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A Semantic Web Primer third Edition 


““ 数 据 万 维 网 ”发展 迅速 ,但 是 如 果 你 真 的 想 要 理解 正在 发 生 什 么 ， 则 需要 理解 其 光环 的 背后 有 什 
么 ”本 书 深入 训 析 并 展示 了 “语义 ”系统 如 何 应 对 规模 的 变化 ， 以 及 是 什么 限制 了 它们 、 杰 书 是 面向 万 
维 网 的 王 程 知识 的 原 汁 原味 、 最 好 的 教材 


一 一 Dave Robertson, % J E K Eii FEE IE 


“本 书 第 3 版 紧 跟 快 速 发 展 的 语义 网 技术 的 步伐 ， 带 领 读者 从 入 门 开始 掌握 语义 网 应 用 开发 的 细节 
本 版 更 好 地 调整 了 内 容 ， 强 调 了 SPARQL 等 关键 技术 并 探讨 了 链接 数据 等 新 趋势 
一 一 Jerome Euzenat， 法 国 朵 家 信息 与 门 动 化 研究 院 (INRIA ) 总 级 研究 科 竺 家 


随 着 网 络 内容 的 机 器 解读 ， 语 义 网 的 发 展 孕 育 着 万 维 网 及 其 应 用 的 一 场 革命 。 本 书 为 这 个 持续 发 展 
的 领域 提供 了 一 个 导 引 ， 描 述 了 其 核心 思想 、 语 言 和 技术 。 本 书 可 用 作 教 材 或 专业 人 员 的 自学 读本 ， 主 
要 介绍 适合 本 科 程 度 的 基础 概念 和 技术 ， 并 提供 了 练习 和 项 目 、 建 议 阅读 材料 等 ， 旨 在 帮助 读者 通过 学 
习 得 以 自行 开发 有 关 的 应 用 。 

第 3 版 彻底 更 新 了 这 本 使 用 广泛 的 教材 ， 提 供 了 大 量 反映 这 个 快速 发 展 领域 的 新 内 容 。 


主要 内 容 包括 
o 对 多 种 语言 ( OWL2、 规 则 ) 的 讲解 扩展 了 RDF 和 OWL， 引 入 了 Turtle 和 RDFa 的 介绍 。 


© 第 4 章 专门 致力 于 介绍 OWL2 这 一 新 的 W3C 标 准 。 

e 新 增 了 对 查询 语言 SPARQL、 规 则 语言 RIF， 以 及 规则 和 本 体 语 言及 应 用 的 交互 可 能 性 的 介绍 。 

@ 第 6 章 关于 语义 网 的 应 用 体现 了 过 去 几 年 语义 网 的 快速 发 展 。 

e 第 7 章 提 供 了 构建 工程 的 思路 。 
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文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ;也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积淀 和 发 展 的 经 典 教 材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 我 们 
就 将 工作 重点 放 在 了 六 选 、 移 译 国 外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson， 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 良 
好 的 合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, 
Brain W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey D. 
Ullman, Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry L. 
Peterson 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 究 
及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 圳 助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指 导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 两 百 
个 品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书籍 。 
其 影印 版 “经 典 原 版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完善 和 教材 改革 的 逐渐 深 
化 ,教育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽善尽美 ， 
而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 

华章 网 站 : www.hzbook.com 
电子 邮件 :hzjsj@hzbook.com 
联系 电话 : (010) 88379604 
联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 华章 科技 图 书 出 版 中 心 - 
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A Semantic Web Primer, Third Edition 


It is with great pride that I wrote the preface to this Chinese translation of the 3rd and revised 
edition of A Semantic Web Primer. 

Much has changed in the Semantic Web community since the publication of the Chinese 
translation of the first edition, in 2007. Semantic Web technology has matured, and has been adopted 
in many different sectors of industry and government across the world. In Chinese in particular, the 
Semantic Web community has strengthened substantially in the past decade. Chinese researchers are 
now contributing world-class research results on Semantic Web technologies, and are well regarded 
internationally. 

The Chinese universities and research foundations have invested substantially in research in 
this field, allowing a new generation of young researchers to develop. 

Also content-wise, the Semantic Web field has developed substantially since the first edition 
of this book. Developments such as OWL2, SPARQL, N3 syntax and many new applications made 
it necessary to update the first edition. We are therefore extremely grateful to Dr. Wei Hu and Dr. 
Gong Cheng of the State Key Laboratory for Novel Software Technology, Dept. of Computer 
Science and Technology of Nanjing University for taking the initiative in the translation of the new 
edition of our book, and for their excellent work on completing this translation in such a short time. 
We also thank Prof. Zhisheng Huang of the VU University for his tireless assistance in this process. 
We could not have wished for a better translation team. 

We sincerely hope that this translated third edition of A Semantic Web Primer will contribute 
to further strengthen the interests in Semantic Web research and development, and that it will be a 
useful aid to students and teachers alike. 


(我 怀 着 非常 自豪 的 心情 为 本 书 的 中 文 翻译 版 撰写 序言 。 

自从 2007 年 本 书 第 1 版 的 中 文 翻译 版 出 版 以 后 ,语义 网 社区 发 生 了 许多 变化 。 语 义 网 技 
术 已 经 成 熟 ， 并 且 在 世界 范围 内 被 工业 界 和 政府 部 门 等 诸多 领域 所 采用 。 尤 其 在 中 国 ， 过 去 
10 年 里 语义 网 社区 已 经 取得 了 实质 性 的 进展 。 中 国 的 研究 人 员 正 在 为 语义 网 技术 贡献 世界 级 
的 研究 成 果 ， 并 且 在 国际 上 也 备 受 关注 。 

中 国 的 大 学 和 科研 基金 对 这 个 领域 投入 颇 多 ， 使 得 新 一 代 的 青年 研究 学 者 得 以 发 展 。 

就 内 容 而 言 ， 自 从 本 书 第 1 版 出 版 以 后 ， 语 义 网 领域 取得 了 诸多 实质 性 的 进展 。 诸 如 
OWL2、SPARQL N3 语法 等 的 发 展 以 及 许多 新 的 应 用 使 得 很 有 必要 对 本 书 第 1 版 进行 修订 。 
在 此 ， 我 们 非常 感谢 南京 大 学 计算 机 软件 新 技术 国家 重点 实验 室 和 计算 机 科学 与 技术 系 的 胡 
伟 博 士 以 及 程 袭 博士 主动 承担 了 本 书 新 版 的 翻译 工作 ， 并 对 他 们 在 这 么 短 的 时 间 里 出 色 地 完 
成 这 项 翻译 工作 表示 谢意 。 我 们 也 感谢 荷兰 阿姆斯特丹 自由 大 学 的 黄 智 生 教授 在 此 过 程 中 不 
知 疲倦 的 支持 。 我 们 很 难 期 竺 有 比 这 更 好 的 翻译 团队 。 

我 们 真诚 地 希望 本 书 能 够 进一步 增强 大 家 对 语义 网 的 研究 和 开发 兴趣 ， 为 老师 和 同学 等 
提供 有 益 帮 助 。) 


Frank van Harmelen 
Grigoris Antoniou 
Paul Groth 

Rinke Hoekstra 
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高 速 发 展 的 万 维 网 已 成 为 人 类 历史 上 影响 最 深远 、 最 广泛 的 信息 传播 媒介 ， 同 时 也 推动 
着 下 一 代 万 维 网 技术 的 发 展 。1998 年 ， 万 维 网 的 发 明 人 蒂 姆 伯 纳 斯 - 李 (Tim Berners-Lee) 
提出 了 语义 网 (Semantic Web， 也 译作 语义 万 维 网 ) 的 设想 。2001 年 ,《 科 学 美国 人 》 杂 志 刊 
登 题 为 “The Semantic Web ”的 科普 文章 ， 宣 告 了 语义 网 的 诞生 。 同 年 ， 万 维 网 联盟 (W3C) 
成 立 了 一 系列 工作 组 ， 致 力 于 制定 语义 网 技术 规范 。 随 着 资源 描述 框架 ( RDF)、 万 维 网 本 体 
语言 (OWL2 )、RDF 查询 语言 ( SPARQL) 及 规则 交换 格式 ( RIF) 等 一 批 技术 规范 被 确立 为 
推荐 标准 ,语义 网 为 万 维 网 上 的 知识 表示 、 推 理 、 交 换 和 复 用 奠定 了 基础 。 随 之 而 来 的 是 语 
义 网 技术 在 众多 领域 的 鞍 勃 发 展 和 广泛 应 用 。 

本 书 是 语义 网 的 入 门 性 教科 书 ， 作 者 在 语义 网 研究 和 应 用 方面 有 着 广博 的 见识 和 丰富 的 
经 验 。 自 2004 年 出 版 第 1 版 以 来 ， 本 书 已 被 许多 大 学 和 研究 机 构 选 为 语义 网 课程 教材 并 被 
翻译 为 多 国语 言 ， 其 中 文 翻译 版 由 中 国 科学 技术 大 学 的 陈小平 教授 等 译 。 伴 随 语义 网 技术 的 
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与 传统 观念 不 同 的 是 ， 信 息 系 统 作为 量 身 定 做 的 、 成 本 密集 型 的 数据 库 应 用 的 时 光一 去 
不 复 返 了 。 这 种 变化 一 部 分 是 受到 逐渐 成 熟 的 软件 产业 的 推动 (软件 产业 大 量 使 用 了 现成 的 
通用 组 件 和 标准 的 软件 解决 方案 )， 而 另 一 部 分 则 是 由 于 信息 革命 的 冲击 。 反 过 来 ， 这 种 改变 
导致 了 对 信息 服务 的 一 系列 全 新 需求 ， 即 要 求 其 表示 模式 与 交互 模式 的 统一 性 、 软 件 体系 结 
构 的 开放 性 以 及 使 用 范围 的 全 局 性 。 这 些 需 求 主 要 来 自 诸如 电子 商务 、 银 行业 、 制 造 业 ( 包 
括 软 件 产 业 本 身 )、 培 训 、 教 育 和 环境 管理 等 领域 ， 恕 不 一 一 列举 。 

未 来 的 信息 系统 必须 支持 与 各 种 运行 在 异 构 平 台 和 分 布 式 信息 网 络 上 的 独立 多 厂商 数据 
源 和 遗留 应 用 的 平滑 交互 。 元 数据 在 描述 这 类 数据 源 并 使 之 融合 为 一 体 时 将 起 到 至 关 重 要 的 
作用 。 

同时 ， 面 向 社区 的 更 多 样 化 交互 模式 将 必须 由 下 一 代 信息 系统 来 提供 支持 。 这 些 交 互 可 
能 涉及 导航 、 查 询 和 检索 ， 并 且 必 须 与 个 性 化 通知 、 标 注 和 分 析 机 制 相 结合 。 这 些 交互 也 将 
必须 提供 与 应 用 软件 的 智能 化 接口 ， 并 且 需 要 动态 地 集成 到 定制 的 、 高 度 连接 的 协同 环境 中 。 
此 外 ， 政 府 和 企业 等 在 信息 资源 上 大 量 投资 ,需要 特定 的 措施 来 确保 其 内 容 的 安全 性 、 保 密 
性 和 准确 性 。 

所 有 这 些 都 是 下 一 代 信 息 系 统 所 面临 的 挑战 ， 我 们 将 这 样 的 系统 称 为 协同 信息 系统 
(cooperative information system )。 

专业 地 讲 ， 协 同 信 息 系 统 将 服务 于 以 内 容 一 社区 一 商务 ( content-community-commerce ) 
为 特征 的 多 样 化 需求 。 这 些 需 求 源 自 现 有 的 软件 解决 方案 (例如 企业 资源 规划 系统 和 电子 商 
务 系统 ) 的 当前 发 展 趋势 。 

建立 协同 信息 系统 的 一 个 主要 挑战 在 于 开发 新 技术 以 满足 目前 大 量 投资 的 信息 资源 和 系 
统 不 断 增强 和 演化 的 需要 。 这 些 技术 必须 提供 一 个 恰当 的 基础 设施 以 支持 软件 开发 和 演化 。 

协同 信息 系统 的 早期 研究 成 果 正 在 成 为 面向 社区 的 信息 门户 或 网 关 的 核心 技术 。 如 一 个 
提供 “一 站 式 购物 ”的 网 关 提供 了 广泛 的 信息 资源 和 服务 ， 从 而 获得 了 一 个 忠实 的 用 户 群 。 

面向 协同 信息 系统 的 研究 进展 并 非 来 自信 息 技术 中 的 单一 研究 领域 。 数 据 库 和 基于 知识 
的 系统 、 分 布 式 系统 、 群 件 以 及 图 形 用 户 界面 都 已 经 是 成 熟 的 技术 。 随 着 个 别 技术 的 逐步 完 
善 ， 技 术 进 步 的 最 大 杠杆 将 来 自 建立 和 管理 一 个 无 颖 连接 的 协同 信息 系统 的 进展 。 

数据 源 中 的 数据 之 所 以 有 用 ， 是 因为 它们 建立 了 现实 世界 及 其 主题 (或 应 用 程序 、 论 域 ) 
的 部 分 模型 。 数 据 语义 ( data semantic) 的 问题 在 于 建立 和 维护 数据 源 ， 即 模型 (model) MIE 
所 涉及 主题 间 的 对 应 关系 。 这 些 模 型 可 以 是 存储 某 公 司 员 工资 料 的 数据 库 ， 描 述 零 件 、 项 目 
与 供应 商 的 数据 库 模 式 ， 提 供 大 学 信息 的 网 站 ,或 描述 滑铁卢 战役 的 一 个 纯 文本 文件 。 这 样 
的 问题 自从 第 一 个 数据 库 出 现 之 后 就 一 直 与 我 们 相伴 。 然 而 ， 只 要 数据 库 的 运行 环境 仍然 是 
封闭 和 相对 稳定 的 ， 该 问题 就 仍然 可 控 。 在 这 样 的 环境 下 ， 数 据 的 含义 可 以 从 数据 库 中 正确 
地 提取 出 来 ， 并 委托 给 一 小 组 常规 用 户 和 应 用 程序 。 

万 维 网 的 出 现 改 变 了 这 一 切 。 今 天 的 数据 库 已 经 以 某 种 方式 在 万 维 网 上 可 用 ， 其 中 用 户 、 
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应 用 程序 及 其 使 用 都 是 开放 的 ， 而 且 处 于 不 断 变 化 之 中 。 在 这 样 的 环境 下 ， 数 据 的 语义 必须 
随 数据 一 起 创建 。 对 于 人 类 用 户 ， 通 过 选择 适当 的 表示 形式 来 实现 。 但 是 对 于 应 用 程序 ， 这 
种 语义 则 必须 以 一 种 形式 化 的 、 机 器 可 处 理 的 形式 提供 。 因 此 需要 语义 网 9. 

ERARE, W e 伯 纳 斯 - 李 的 倡议 受到 了 研究 人 员 和 开发 人 员 等 的 巨大 关注 。 现 在 已 
有 国际 语义 网 系列 会 议 8、 爱 思 唯 尔 出 版 的 《 Semantic Web Journal) ©, WP VERA IEE 
关注 第 一 代 语 义 网 技术 标准 。 

本 书 介 绍 了 语义 网 概念 ， 包 括 XML. DTD 和 XML 模式 ，RDF #I RDFS, OWL, Wi 
和 推理 等 。 本 书 的 另 一 个 特色 是 通 篇 使 用 例子 和 应 用 来 展现 概念 。 希 望 读 者 会 觉得 本 书 有 趣 、 
精辟 ， 并 从 中 受益 。 


© Tim Berners-Lee and Mark Fischetti, Weaving the Web: The Original Design and Ultimate Destiny of the World 
Wide Web by Its Inventor, San Francisco: HarperCollins, 1999. 

http://iswc.semanticweb.org. 

期 刊 名 称 应 为 《Journal of Web Semantics 》， 正 确 的 网 址 是 : http:Wwww.websemanticsjournal.org/， 另 有 一 个 
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语义 网 的 愿景 





1.1.1 语义 网 的 动机 

“语义 网 ”的 主要 愿景 可 以 概括 为 一 句 话 : 使 计算 机 更 能 解读 万 维 网 (to make the web 
more accessible to computers)。 当前 万 维 网 是 一 个 文字 和 图 片 网 络 ， 这 些 媒体 对 人 而 言 很 有 
用 ， 但 是 计算 机 在 目前 的 万 维 网 上 只 发 挥 了 非常 有 限 的 作用 : 它们 索引 关键 词 ， 将 信息 从 服 
务 器 端 传输 到 客户 端 ， 仅 此 而 已 。 所 有 的 智能 工作 EE. AA. RES) 必须 通过 人 类 读 
者 来 完成 。 如 果 我 们 能 够 使 得 万 维 网 更 适合 机 器 处 理 ， 使 得 万 维 网 上 充满 机 器 可 读 取 、“ 可 理 
解 ” 的 数据 (data) 将 会 如 何 ?” 这样 的 一 个 万 维 网 将 有 助 于 完成 许多 在 当前 万 维 网 上 不 可 行 的 
事情 : 搜索 (search) 将 不 再 局 限于 简单 地 查找 关键 词 ， 而 将 变 得 更 加 语义 化 ， 包 括 查 询 同 义 
词 ， 识 别 同音 异 义 词 ， 并 且 考 虑 搜索 查询 的 情境 和 意图 。 如 果 个 人 浏览 agent 能 够 理解 一 个 网 
页 的 内 容 并 将 其 裁剪 为 个 人 感 兴 趣 的 概述 ， 网 站 将 变 得 更 加 个 性 化 ( personalized)。 通 过 当前 
用 户 的 活动 来 动态 确定 哪些 网 页 会 是 有 用 的 目的 地 ， 而 非 为 所 有 用 户 预 先 硬 编码 相同 的 链接 ， 
链接 (linking) 将 变 得 更 加 语义 化 。 路 网 站 集成 (integrate) 信息 也 将 成 为 可 能 ， 而 不 像 目前 
用 户 在 某 个 网 站 发 现 了 一 些 信息 ， 只 能 “精神 上 复制 -粘贴 ”到 他 们 想 要 组 合 信息 的 另 一 个 
网 站 。 


1.1.2 ”语义 网 的 设计 方案 

着 手 构 建 一 个 更 “语义 的 ”万 维 网 有 多 种 方式 。 一 种 方式 可 以 是 构建 一 个 “巨型 
Google”， 依 赖 “数据 不 可 思议 的 效力 ”9 来 发 现 诸如 词语 之 间 、 术 语 和 情境 之 间 的 正确 关联 。 
我 们 在 过 去 几 年 中 已 经 见证 了 搜索 引擎 性 能 的 停滞 ， 这 似乎 暗示 了 此 种 方法 存在 缺陷 : 没有 
一 个 搜索 巨头 能 够 超越 仅 返 回 分 散 页 面 的 简单 扁平 列表 的 情况 。 

语义 网 (或 近年 来 被 逐渐 熟知 的 数据 万 维 网 98) 则 遵循 了 不 同 的 设计 原则 ， 可 以 概括 如 下 : 

1) 使 得 结构 化 和 半 结 构 化 的 数据 以 标准 化 的 格式 在 万 维 网 上 可 用 ; 

2) 不 仅 制造 数据 集 ， 还 创建 万 维 网 上 可 解读 的 个 体 数据 元 素 及 其 关系 ; 


© The Unreasonable Effectiveness of Data, Alon Halevy, Peter Norvig, and Fernando Pereira, IEEE Intelligence 
Systems, March/April 2009, pgs. 8-12, http://static.googleusercontent.com/external_content/untrusted_dlcp/ 
research.google.com/en//pubs/archive/35179.pdf. 

© http://www.readwriteweb.com/archives/web_of_data_machine_accessible_information.php. 
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3 ) 使 用 形式 化 模型 来 描述 这 些 数据 的 隐 售 语义 ， 使 得 这 些 隐 含 语义 能 够 被 机 器 处 理 。 

决定 利用 结构 化 和 半 结 构 化 数据 基于 一 个 关键 的 观察 结论 ， 即 在 当前 无 结构 的 “文本 和 
图 片 万 维 网 ”之 下 实际 上 存在 着 大 量 结构 化 和 半 结 构 化 数据 。 万 维 网 的 绝 大 部 分 内 容 正 是 从 
数据 库 和 包含 仔细 结构 化 了 的 数据 集 的 内 容 管理 系统 中 产生 的 。 然 而 ， 这 些 数据 集中 可 用 的 
富 结构 在 结构 化 数据 发 布 为 人 们 可 读 的 超 文本 标记 语言 (Hypertext Markup Language, HTML) 
页 面 的 过 程 中 几乎 完全 丢失 了 (参见 图 1-1 )。 一 个 关键 认识 在 于 ， 如 果 我 们 能 发 布 和 互联 
(interlink) 底层 的 结构 化 数据 集 (而 不 仅 是 在 底层 结构 丢失 后 发 布 和 互联 HTML 页 面 )， 我们 
已 经 朝 构 建 一 个 更 加 语义 的 万 维 网 愿景 迈进 了 一 大 步 。 








图 1-1 万 维 网 上 的 结构 化 和 半 结 构 化 数据 


1.1.3 ”语义 网 的 基础 技术 

之 前 提 到 的 3 个 设计 原则 已 经 被 转化 为 实际 的 技术 ， 而 本 书 的 大 部 分 内 容 将 致力 于 介绍 
这 些 技术 。 

1) 使 用 带 标 签 的 图 (labeled graph) 作为 对 象 及 其 关系 的 数据 模型 ， 图 中 将 对 象 作为 
节点 ， 对 象 间 的 关系 表示 为 边 。 使 用 被 草草 命名 为 “资源 描述 框架 ”( Resource Description 
Framework, RDF) 9 的 形式 化 模型 来 表示 这 种 图 结构 。 

2) 使 用 万 维 网 标识 符 (统一 资源 标识 符 (Uniform Resource Identifier, URI)) 来 标识 出 现 
在 数据 集中 的 单个 数据 项 以 及 它们 之 间 的 关系 。 这 同样 反映 在 RDF 的 设计 中 。 

3) 使 用 本 体 (ontology， 简 言 之 : 类 型 和 关系 的 层次 化 词汇 表 ) 作为 数据 模型 来 形式 化 
地 表达 数据 的 隐 含 语义 。 诸 如 RDF 模式 (RDF schema) 和 万 维 网 本 体 语 言 ( Web Ontology 
Language， OWL) 的 形式 化 模型 被 用 于 该 目的 ， 同 样 也 使 用 URI 来 表示 类 型 和 它们 的 属性 。 


1.1.4 “从 数据 到 知识 
为 了 真正 捕获 数据 的 隐 含 语义 ， 诸 如 RDF 模式 和 OWL 的 形式 化 模型 不 仅 是 数据 描述 语 


© 可 能 “ 富 数据 格式 " (Rich Data Format) 是 一 个 更 好 的 名 字 。 
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言 ， 实 际 上 还 是 轻 量 级 的 知识 表示 (knowledge representation) 语言 ， 认 识 到 这 点 很 重要 。 它 
们 是 允许 从 显 式 声明 的 信息 中 推理 出 额外 信息 的 “逻辑 ”。RDF 模式 是 一 种 表达 能 力 很 弱 的 
逻辑 ， 它 允许 一 些 非常 简单 的 推理 ,例如 在 一 个 类 型 层次 上 的 属性 继承 、 定 义 域 / 值 域 的 类 
型 推理 。 类 似 地 ，OWL 是 一 种 表达 能 力 颇 强 (但 依然 相对 轻 量 级 ) 的 逻辑 ， 它 允许 更 多 的 推 
理 ,例如 等 价 和 不 等 价 、 数 量 限制 、 对 象 的 存在 和 其 他 。RDF 模式 和 OWL 中 的 这 些 推理 为 
信息 发 布 者 提供 了 创建 一 个 事实 的 最 小 下 界 的 可 能 性 ， 读 者 必须 相信 这 些 被 发 布 的 数据 。 此 
Sh, OWL 为 信息 发 布 者 提供 了 禁止 信息 阅读 者 相信 被 发 布 数据 的 某 些 事情 的 可 能 性 (至 少 只 
要 每 个 人 打算 与 被 发 布 的 本 体 保持 一 致 性 )。 

综 上 所 述 ， 在 这 些 逻 辑 上 执行 推理 相当 于 对 发 布 数据 的 隐 含 语义 同时 施加 了 下 界 和 上 界 。 
通过 逐步 精炼 这 些 本 体 ， 这 些 下 界 和 上 界 能 够 任意 地 靠近 ， 因 此 为 了 始终 精确 地 确认 数据 的 
隐 含 语义 ， 在 一 定 程度 上 需要 直接 提供 用 例 。 


1.1.5 “语义 网 的 万 维 网 体系 结构 

传统 万 维 网 的 一 个 重要 方面 在 于 它 的 内 容 是 分 布 式 的 ， 不仅 位 置 上 是 ， 所 有 权 上 也 是 : 
相互 链接 的 网 页 经 常 存在 于 不 同 的 万 维 网 服务 器 ， 这 些 服务 融 位 于 不 同 的 物理 位 置 并 由 不 同 
的 组 织 所 有 。 对 万 维 网 发 展 起 到 关键 作用 的 是 “任何 人 可 以 说 关于 任何 事 的 任何 话 ”S， 或 更 
准确 地 说 : 任何 人 可 以 参考 其 他 任何 人 的 网 页 ， 而 无 须 先 协商 允许 ， 或 征求 合适 的 地 址 或 标 
识 符 来 使 用 。 语 义 网 也 采用 了 类 似 的 机 制 (参见 图 1-2 ) : 第 一 个 组 织 可 以 在 万 维 网 上 发 布 一 
个 数据 集 (图 1-2 的 左 侧 )， 第 二 个 组 织 可 以 独立 发 布 一 个 术语 表 (图 1-2 的 右 侧 )， 而 第 三 个 
组 织 可 能 会 决定 使 用 第 二 个 组 织 发 布 的 术语 来 标注 第 一 个 组 织 的 对 象 ， 而 无 需 经 过 他 们 中 任 
何 一 方 的 允许 ， 并 且 事 实 上 这 两 个 组 织 甚至 都 不 知道 这 件 事 情 。 这 种 解 耦合 是 语义 网 的 万 维 
网 式 特 征 的 本 质 。 
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图 1-2 链接 数据 的 万 维 网 体系 结构 


1.1.6 ”如 何 由 此 及 彼 
当然 ， 需 要 一 些 重要 步骤 来 实现 上 述 愿景 以 及 将 上 述 体系 结构 原则 变 为 可 行 的 现实 。 
1 ) 我 们 必须 同意 使 用 标准 的 语法 来 表示 数据 和 元 数据 。 | 
2) 我 们 必须 对 元 数据 词汇 表 取 得 足够 的 共识 ， 使 得 可 以 分 享 数据 的 隐 含 语义 。 
3 ) 我 们 必须 使 用 第 1 ) 步 的 格式 和 第 2 ) 步 的 词汇 表 来 发 布 大 量 的 数据 。 


© http://www.w3.org/Designlssues/RDFnot.html。 
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20 世纪 (最 早 的 语义 网 项 目 始 于 20 世纪 的 最 后 几 年 )， 以 上 3 个 步骤 都 取得 了 实质 性 进 
展 : RDF, RDF 模式 和 OWL (以 及 它们 的 变种 ， 例 如 RDFa、OWL2 等 ) 已 经 获得 了 万 维 网 
联盟 ( World Wide Web Consortium, W3C) 的 正式 支持 ， 将 它们 提升 为 万 维 网 上 的 事实 标准 。 
数 以 千 计 的 词汇 表 使 用 这 些 格式 发 布 8， 并 且 这 些 词 汇 表 间 的 汇聚 已 经 开始 发 生 ， 这 有 既是 自动 
化 本 体 映 射 技 术 ， 也 是 社会 和 经 济 需 求 施 压 的 结果 (例如 ，schema.org 词汇 表 的 开发 ) 9S。 此 
外 ， 链 接 数 据 云 (Linked Data Cloud) 9 的 发 展 也 使 得 数 以 十 亿 计 使 用 共享 的 语法 和 词汇 表 的 
对 象 以 及 它们 间 的 关系 在 线 可 用 。 


1.1.7 ”我 们 的 现状 

Xt LASS 2003 年 出 版 第 1 版 时 的 情况 ,许多 基础 构件 已 经 就 绪 。 许 多 快速 成 熟 的 技术 支 
撑 了 语义 网 技术 的 所 有 部 署 阶段 ， 商 业 领 域 和 开放 组 织 的 真实 案例 的 数目 也 在 快速 增长 。 但 
是 ， 主 要 的 挑战 依然 存在 ， 例 如 应 对 持续 增长 的 规模 、 降 低 使 用 的 门槛 ， 当 然 还 有 与 信息 系 
统 中 无 所 不 在 的 “毒药 ": 语义 异 构 性 的 斗争 。 


1.2 语义 网 技术 


1.2.1” 显 式 元 数据 
当前 ， 万 维 网 上 内 容 的 格式 更 适合 人 类 读者 而 非 计 算 机 程序 .HTML 是 (直接 或 借助 工具 ) 
撰写 网 页 的 主流 语言 。 一 个 理疗 师 的 典型 网 页 的 一 部 分 可 能 如 下 所 示 : 


<h1>Agilitas Physiotherapy Centre</h1> 

Welcome to the Agilitas Physiotherapy Centre home page. 
Do you feel pain? Have you had an injury? Let our staff 
Lisa Davenport, Kelly Townsend (our lovely secretary) 
and Steve Matthews take care of your body and soul. 
<h2>Consultation hours</h2> 

Mon llam - 7pm<br> 

Tue llam - 7pm<br> 

Wed 3pm - 7pm<br> 

Thu llam - 7pm<br> 

Fri llam - 3pm<p> 

But note that we do not offer consultation 

during the weeks of the 


<a href=: . .”>State of Origin</a> games. 


对 人 们 而 言 ， 这 些 信息 以 一 个 令 人 满意 的 方式 表达 ， 但 是 对 机 器 而 言 则 存在 问题 。 基 于 关键 


© http://swoogle.umbc.edu。 
© http://schema.org. 
© _http://linkeddata.org. 
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词 的 搜索 会 识别 physiotherapy 和 consultation hours 等 词 。 并 且 一 个 智能 agent 甚至 能 够 识别 
该 中 心 的 全 体 人 员 。 但 是 ， 区 分 治疗 师 和 秘书 则 会 存在 困难 ， 查 找 准 确 的 咨询 时 间 还 会 碰 到 
更 大 的 困难 (因为 不 得 不 沿 着 State of Origin 游戏 的 链接 来 查找 它们 发 生 的 时 间 )。 
解决 这 些 问题 的 语义 网 方法 不 是 开发 一 种 超级 智能 的 agent， 而 是 尝试 从 网 页 端 人 手 。 如 
果 HTML 能 够 被 更 适合 的 语言 取代 ， 网 页 就 可 以 携带 它们 的 内 容 。 在 包含 为 人 类 读者 生成 的 
文档 格式 信息 的 同时 ， 网 页 还 可 以 包含 有 关 它 们 内 容 的 信息 。 
在 这 个 方向 上 的 第 一 步 是 可 扩展 标记 语言 (eXtensible Markup Language, XML), EYF 
在 网 页 上 定义 信息 的 结构 。 在 该 例子 中 ， 可 能 存在 以 下 信息 : 


<company> 
<treatmentOffered>Physiotherapy< /treatmentOffered> 
<companyName>Agilitas Physiotherapy Centre</companyName> L] 
<staff> 
<therapist>Lisa Davenport< /therapist> 
<therapist>Steve Matthews< /therapist> 
<secretary> Kelly Townsend< /secretary> 
</staff> 
</company> 
这 种 表达 形式 非常 容易 被 机 器 处 理 。 特 别 是 ， 它 适用 于 万 维 网 上 的 信息 交换 ， 这 是 XML 
技术 最 重要 的 一 个 应 用 领域 。 
但 是 ，XML 依然 处 于 语法 层次 ， 因 为 它 描述 的 是 信息 的 结构 (structure)， 而 非 信息 的 含 
义 (meaning)。 语 义 网 的 基础 语言 是 RDF， 它 是 一 种 生成 有 关 信息 片段 声明 的 语言 。 在 该 例 
子 中 ， 这 样 的 声明 包括 : 


Company A offers physiotherapy. 
The name of A is "Agitilitas Physiotherapy". 
Lisa Davenport is a therapist. 


Lisa Davenport works for A. 


WEAKER, XML 表示 形式 和 一 个 RDF 声明 列表 的 差异 微不足道 ， 但 是 它们 本 质 上 非常 
不 同 : XML 描述 的 是 结构 而 RDF 生成 的 是 信息 片段 的 声明 9。 

元 数据 (metadata) 一 词 的 含义 是 : 关于 数据 的 数据 。 元 数据 捕获 数据 的 含义 (meaning) [9] 
部 分 ， 也 就 是 语义 网 中 所 说 的 语义 (semantic) 一 词 。 


1.2.2 本体 
本 体 (ontology) 一 词 源 于 哲学 。 在 哲学 中 ， 它 被 用 作 一 个 哲学 子 领域 的 名 称 ， 即 对 存在 
全 ”人 类 读者 通过 选择 标签 名 称 将 含义 赋予 XML 表示 形式 ， 但 是 这 对 机 器 处 理 器 而 言 还 不 够 。 


1% 





的 本 质 的 研究 (希腊 单词 的 Ovrohoyia)， 它 属于 形而上学 的 一 个 分 支 ， 以 最 通俗 的 术语 而 言 ， 
它 关注 于 识别 真实 存在 的 事物 的 类 别 ， 以 及 如 何 描述 它们 。 例 如 ， 世 界 是 由 具体 事物 构成 的 ， 
这 些 事物 根据 共享 的 属性 可 以 被 归 类 到 抽象 的 类 别 ， 这 种 观测 是 一 种 典型 的 本 体 化 任务 。 

但 是 ， 近 些 年 来 ， 本 体 成 为 被 计算 机 科学 领域 引进 的 许多 单词 之 一 ， 并 且 被 赋予 了 一 个 
与 原始 含义 过 然 不 同 的 具体 技术 含义 。 我 们 现在 使 用 “一 个 本 体 ” 来 代替 “本 体 ”。 针 对 我 们 
的 目标 ， 我 们 将 使 用 T R. Gruber 的 定义 ， 这 个 定义 后 来 由 R. Studer 修订 : 一 个 本 体 是 一 个 
概念 体系 的 一 种 显 式 的 、 形 式 化 的 归 约 (An ontology is an explicit and formal specification of a 
conceptualization ) 。 

通常 ， 一 个 本 体形 式 化 地 描述 了 一 个 论 域 。 典 型 地 ， 一 个 本 体 由 一 个 包含 术语 以 及 术语 
间 的 联系 的 有 限 列表 组 成 。 术 语 (term) 指称 领域 中 的 重要 概念 (concept， 对 象 的 类 (class) )。 
例如 ， 对 于 一 个 大 学 领域 , 教 职 工 、 学 生 、 课 程 、 阶 梯 教 室 和 学 科 是 一 些 重要 概念 。 

一 般 地 讲 ， 联 系 (relationship) 刻画 了 类 的 层次 性 。 一 个 层次 描述 了 一 个 类 C 是 男 一 个 类 
C ' 的 子 类 ， 仅 当 C 中 的 每 个 对 象 也 属于 C'。 例 如 ， 所 有 教师 都 是 教 职 工 。 图 1-3 描述 了 大 学 
领域 的 这 样 一 个 层次 结构 。 





图 1-3 一 个 层次 结构 


除了 子 类 联系 之 外 ， 本 体 还 可 能 包含 以 下 信息 : 

。 属性 (X teaches Y ); 

。 值 限制 (只 有 教师 才能 授课 ); 

。 不 相交 声明 (教师 和 普通 教工 是 不 相交 的 ); 

。 对 象 间 人 逻辑 关系 的 说 明 (每 个 院 系 必须 至 少 有 10 位 教师 )。 

万 维 网 环境 下 ， 本 体 提 供 了 某 个 领域 的 一 个 共享 的 理解 。 该 共享 的 理解 对 于 克服 术语 上 
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的 差异 必 不 可 少 。 例如， 一 个 应 用 中 的 邮编 (zip code) 可 能 与 另 一 个 应 用 中 的 邮编 (postcode) 
一 样 。 另 一 个 问题 是 ， 两 个 应 用 可 能 使 用 相同 的 术语 来 表示 不 同 的 含义 。 在 大 学 A 中 ， 
course 可 能 指 的 是 一 门 学 位 (如 计算 机 科学 )， 而 在 大 学 B 中 则 可 能 是 一 个 科目 (如 CS 101). 
这 种 差异 可 以 通过 将 特殊 的 术语 映射 到 一 个 共享 的 本 体 或 定义 本 体 间 的 直接 映射 来 克服 。 无 
论 是 何 种 情况 ， 都 可 以 明显 看 出 本 体 提供 了 对 语义 互 操作 性 的 支持 。 
本 体 有 助 于 网 站 的 组 织 和 导航 。 现 在 的 许多 网 站 在 页 面 的 左边 呈现 了 一 个 术语 的 概念 层 
次 的 顶层 目录 。 用 户 可 以 点 击 它们 来 展开 子 目 录 。 
同时 ， 本 体 有 助 于 提高 万 维 网 搜索 的 准确 性 。 搜 索引 擎 可 以 寻找 指向 一 个 本 体 中 一 个 精 
确 概念 的 页 面 ， 而 不 是 通过 某 些 含 糊 的 关键 词 收集 到 的 所 有 页 面 。 通 过 这 种 方式 ， 网 页 和 查 
询 之 间 术 语 上 的 差异 可 以 克服 。 
此 外 ,万维网 搜索 可 以 利用 一 般 化 / 特殊 化 信息 。 如 果 一 个 查询 无 法 找到 任何 相关 文档 ， 
那么 搜索 引 警 可 以 建议 用 户 使 用 一 个 更 一 般 的 查询 。 其 至 搜索 引擎 可 以 预先 执行 这 样 的 查询 
来 降低 用 户 采 用 这 一 建议 的 响应 时 间 。 或 者 在 获得 太 多 的 搜索 结果 时 ， 搜 索引 擎 可 以 建议 用 
户 使 用 更 特殊 的 查询 。 
人 工 智 能 (Artificial Intelligence, AI) 领域 中 ， 开 发 和 使 用 本 体 语 言 已 经 有 很 长 的 历史 。 
这 是 语义 网 研究 可 以 依赖 的 基础 。 目 前 ， 万 维 网 上 最 重要 的 本 体 语言 包括 : 
。 RDF 模式 是 一 种 词汇 表 描 述 语 言 ， 用 来 描述 RDF 资源 的 属性 和 类 ， 以 及 这 些 属性 和 
类 的 泛 化 层次 的 语义 。 此 外 ， 属 性 的 定义 域 和 值 域 也 可 以 定义 。 

。 OWL 是 一 种 描述 属性 和 类 的 更 丰富 的 词汇 表 描 述 语言 ， 例 如 类 之 间 的 关系 (比如 不 相 
交 )、 基 数 (比如 “恰好 等 于 1”)、 相 等 、 更 加 丰富 的 属性 类 型 定义 、 属 性 的 性 质 ( 比 
如 对 称 性 )， 以 及 枚 举 类 等 。 


1.2.3 ”逻辑 

逻辑 是 一 门 研究 推理 的 原理 的 学 科 ， 它 可 以 追溯 到 亚 里 士 多 德 (Aristotle)。 一 般 而 言 ， 
逻辑 首先 提供 形式 语言 (formal language) 来 表达 知识 。 其 次 ， 逻 辑 为 我 们 提供 广泛 理解 的 形 
式 语 义 (well-understood formal semantics): 在 绝 大 多 数 逻 辑 中 ， 句 子 的 含义 不 需要 通过 对 知 
识 的 操作 来 定义 。 我 们 常 提 到 描述 性 知识 : 我 们 描述 什么 是 成 立 的 ， 而 不 需要 关心 它 如 何 被 
推断 出 来 。 

再 者 ， 自 动 化 的 推理 机 能 够 从 给 定 知识 中 推断 (推导) 出 结论 ， 因 而 使 得 隐 式 的 知识 显 式 
化 。 这 些 推理 机 已 经 在 人 工 智 能 领域 中 广泛 研究 。 这 里 有 一 个 推导 的 例子 。 假 设 我 们 知道 所 
有 的 教授 都 是 教师 ， 所 有 的 教师 都 是 教 职 工 ， 而 Michael 是 一 名 教授 。 在 谓词 逻辑 中 ， 这 些 
言 息 可 以 表述 如 下 : 


prof(X) = faculty(X) 
faculty(X) > staff X) 


prof (michael) 


Go 
X 
a 
Re 





接 下 来 ,我们 可 以 推断 出 下 列 知识 : 
faculty(michael) 
staff( michael) 
prof(X) > staff(X) 


注意 ， 这 个 例子 中 包含 了 本 体 中 常见 的 知识 。 因 此 ， 逻 辑 能 够 用 于 揭露 隐 式 给 定 的 本 体 知识 。 
通过 逻辑 推理 ， 也 可 以 发 现 未 知 的 联系 和 不 一 致 性 。 

但 是 逻辑 比 本 体 更 加 宽泛 。 逻 辑 还 可 以 被 智能 agent 用 于 决策 和 选择 动作 路 线 。 例 如 ， 一 
个 购物 agent 可 能 决定 基于 下 面 的 规则 给 某 位 顾客 一 个 折扣 : 


loyalCustomer(X) > discount(X,5%) 


其 中 ， 顾 客 的 忠诚 度 由 存储 在 企业 数据 库 中 的 数据 确定 。 

通常 ， 在 表达 能 力 和 计算 高 效 性 之 间 存 在 一 个 权衡 。 一 个 逻辑 的 表达 能 力 越 强 ， 它 生成 
结论 的 计算 代价 就 变 得 越 昂 贵 。 甚 至 当 遇 到 不 可 计算 性 障碍 时 ， 生 成 某 些 结论 将 变 得 不 可 能 。 

幸运 的 是 ， 和 语义 网 相关 的 大 量 知 识 看 起 来 是 一 种 相对 受 限 的 形式 。 例 如 ， 之 前 的 例子 包含 

了 规则 的 形式 “如 果 前 提 ， 那 么 结论 "， 其 中 前 提 和 结论 是 简单 的 声明 ， 并 且 只 有 有 限 个 对 象 
需要 被 考察 。 这 个 逻辑 子 集 称 为 Horn 逻辑 ， 是 易 处 理 的 并 且 由 高 效 的 推理 工具 支持 。 

逻辑 的 一 个 重要 的 优点 是 它 能 够 提供 结论 的 解释 (explanation): 推导 步骤 的 序列 是 可 回 
漳 的 。 而 且 人 工 智能 领域 的 研究 人 员 已 经 开发 出 对 人 类 友好 的 方式 来 展现 解释 ， 通 过 将 一 个 
证 明 组 织 成 一 个 自然 的 推导 过 程 ， 并 将 一 组 底层 的 推导 步骤 归 类 成 人 们 通常 认为 的 单个 证 明 
步骤 的 元 步 又。 最 终 解 释 将 从 答案 回溯 到 一 个 给 定 的 事实 和 使 用 的 推理 规则 的 集合 。 

解释 对 于 语义 网 很 重要 ， 因 为 它们 增加 了 用 户 对 语义 网 agent 的 信心 (参见 之 前 的 理疗 师 
例子 )。Tim Berners-Lee 提 到 过 一 个 “Oh yeah? ”按钮 来 请 求解 释 。 

解释 对 于 agent 之 间 的 活动 也 必 不 可 少 。 当 一 些 agent 有 能 力 生成 逻辑 结论 时 ， 另 一 些 则 
有 能 力 验证 证 明 (validate proof)， 即 检查 一 个 由 其 他 agent 生成 的 断言 是 否 可 以 被 证 明 。 这 里 
有 一 个 简单 的 例子 。 假 设 agent 1， 代 表 一 个 在 线 商 店 ， 发 送 一 条 消息 “你 欠 我 80 美元 ”( 当 
然 ， 不 是 以 自然 语言 的 形式 ， 而 是 用 一 种 形式 化 的 、 机 器 可 处 理 的 语言 ) 给 agent 2 (代表 一 
个 人 )。 然 后 ，agent 2 可 能 会 要 求 提供 解释 ， 而 agent 1 可 能 响应 一 个 如 下 形式 的 序列 : 





购买 超过 80 美元 商品 的 万 维 网 日 志 

商品 交付 证 明 (例如 ，UPS 的 追踪 号 ) 

使 用 商店 术语 和 条 件 的 规则 : 

purchase(X, Item) ^ price(Item, Price) ^A delivered(Item, X) 
一 owes(X, Price) 


这 些 事实 通常 将 被 追溯 到 某 些 网 址 (它们 的 可 信 性 可 以 被 agent 验证 )， 而 这 些 规则 可 能 是 一 
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个 共享 的 商业 本 体 或 者 在 线 商店 政策 的 一 部 分 。 

对 于 万 维 网 上 有 用 的 逻辑 ， 它 必须 能 和 其 他 数据 一 同 使 用 ， 并 且 还 必须 可 以 被 机 器 处 理 。 
因此 使 用 万 维 网 语言 来 表达 逻辑 知识 和 证 明 还 在 进行 中 。 早 期 的 方法 工作 在 XML 层次 ,但 
是 在 未 来 ， 规 则 和 证 明 将 需要 表示 在 RDF 和 本 体 语言 层次 。 


1.2.4 ”语义 网 与 人 工 智能 

正如 我 们 所 说 的 ， 实 现 语 义 网 所 需 的 大 部 分 技术 建立 在 人 工 智 能 领域 工作 的 基础 上 。 尽 
管 人 工 智能 拥有 很 长 的 历史 ,但 它 在 商业 上 并 不 是 一 直 成 功 的 ， 人 们 或 许 会 担心 ， 最 坏 情 况 
下 ,语义 网 将 重 蹈 人 工 智 能 的 覆 略 : 大 的 承诺 导致 过 高 的 期 待 ， 最 终 发 现 无 法 实现 (至 少 不 
是 在 许诺 的 时 间 范 围 内 实现 )。 i 

这 个 担心 是 不 公平 的 。 实 现 语义 网 愿景 并 不 依赖 于 人 类 层次 的 智能 ; 事实 上 ， 正 如 我 们 
尝试 解释 的 那样 ， 语 义 网 是 以 一 种 不 同 的 方式 来 接近 挑战 。 人 工 智能 的 完整 问题 是 一 个 深层 
次 的 科学 问题 ， 可 能 与 物理 学 (解释 物理 世界 ) 或 者 生物 学 (解释 生物 世界 ) 的 核心 问题 相 
当 。 正 如 所 见 ， 没 有 实现 过 去 某 些 时 候 曾 许诺 的 在 10~20 年 里 实现 人 类 层次 的 人 工 智能 ， 并 
没有 令 人 感到 吃惊 。 

但 是 在 语义 网 上 ， 部 分 解决 方案 是 可 行 的 。 即 使 一 个 智能 agent 不 能 生成 一 个 人 类 用 户 可 
以 生成 的 所 有 结论 ， 相 比 现在 ， 这 个 agent 仍然 对 万 维 网 贡献 良 多 。 这 为 我 们 带 来 了 另 一 个 区 
别 。 如 果 人 工 智能 的 最 终 目标 是 建立 一 个 表达 人 类 层次 智力 (或 更 高 层次 ) 的 智能 agent, i 
义 网 的 目标 则 是 辅助 人 类 用 户 参 与 日 常 在 线 活动 。 

显而易见 ,语义 网 频繁 使 用 当前 的 人 工 智能 技术 ， 而 人 工 智 能 技术 的 发 展 将 带 来 一 个 更 
好 的 语义 网 。 但 是 不 必 等 到 人 工 智能 取得 更 高 层次 的 成 就 ， 当 前 的 人 工 智 能 技术 已 经 足够 在 
很 长 一 段 时 间 内 实现 语义 网 的 愿景 。 


1.3 ”一 种 分 层 方法 

语义 网 的 发 展 按 步 又 进行 ， 每 步 都 在 一 个 层次 之 上 建立 男 一 个 层次 。 这 个 方法 的 实用 性 
论证 是 它 更 容易 在 小 的 步骤 上 达成 一 致 ， 也 就 是 说 ， 如 果 有 太 多 的 目标 ， 则 很 难 让 参与 的 每 
个 人 都 同意 。 通 常 许多 研究 组 研究 不 同 的 方向 ， 思 想 的 竞争 是 科学 进步 的 主要 驱动 力 。 但 是 ， 
从 工程 的 角度 则 需要 标准 化 。 因 此 ， 如 果 绝 大 多 数 研 究 人 员 同 意 某 些 事情 而 反对 男 一 些 , 稳 
固 这 些 共识 则 是 有 意义 的 。 这 样 ， 即 使 一 些 更 有 野心 的 研究 成 果 会 失败 ， 但 是 至 少 有 部 分 正 
面 的 结果 。 


一 旦 一 个 标准 被 确立 ,许多 组 织 和 公司 将 采用 它 而 不 是 等 待 着 观察 最 终 是 否 有 可 替代 的 . 


研究 路 线 会 成 功 。 语 义 网 的 本 质 在 于 公司 和 单个 用 户 必 须 构 建 工具 、 添 加 内 容 并 使 用 这 些 内 
容 。 我 们 无 法 等 到 完整 的 语义 网 愿景 变 成 熟 一 一 这 可 能 还 要 10 年 时 间 来 完全 实现 它 (当然 ， 
是 以 今天 的 想象 )。 

在 一 个 语义 网 层次 上 构建 男 一 个 层次 的 过 程 中 ， 必 须 遵 循 两 个 原则 。 

。 向 下 兼容 性 。 完 全 理解 某 一 层次 的 agent 应 该 能 够 解释 和 使 用 更 低层 次 的 信息 。 例 如 ， 
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理解 OWL 语义 的 agent 能 够 充分 利用 RDF 和 RDF 模式 中 的 信息 。 

© 向 上 部 分 理解 。 设 计 应 该 使 得 完全 理解 某 一 层次 的 agent 应 该 能 够 至 少 部 分 利用 更 高 
层次 的 信息 。 例 如 ， 一 个 仅 理解 RDF 和 RDF 模式 语义 的 agent 可 能 能 够 通过 忽略 超出 
RDF 和 RDF 模式 的 元 素 ， 部 分 地 解释 OWL 中 的 知识 。 当 然 ， 并 不 是 要 求 所 有 工具 都 
提供 这 种 功能 性 ， 关 键 在 于 允许 这 种 选择 。 

虽然 这 些 想法 理论 上 很 吸引 人 并 且 被 作为 指导 原则 来 指导 语义 网 的 发 展 ， 实 践 上 却 存在 
困难 ， 并 且 不 得 不 采取 某 些 妥协 。 这 在 第 4 章 讨论 RDF 和 OWL 分 层 时 会 进一步 说 明 。 

图 1-4 展示 了 语义 网 的 “分 层 蛋糕 " ， 它 描述 了 语义 网 设计 和 愿景 的 主要 层次 。 在 最 底层 
我 们 可 以 发 现 XML， 一 种 允许 用 户 使 用 用 户 定义 的 词汇 表 来 撰写 结构 化 万 维 网 文档 的 语言 。 
XML 特别 适合 于 在 万 维 网 上 发 送 文 档 。 此 外 ， 用 于 XML 中 的 URI 可 以 按照 它们 的 命名 空间 
(namespace) 聚 类 ， 在 图 中 表示 为 NS。 








图 1-4 语义 网 的 一 个 分 层 方法 


RDF 是 一 个 基本 数据 模型 ， 正 如 实体 -联系 模型 一 样 ， 它 表达 了 万 维 网 对 象 (资源 ) 的 
声明 。RDF 数据 模型 不 依赖 于 XML， 但 是 RDF 有 一 个 基于 XML 的 语法 。 因 此 ， 在 图 1-4 
中 ，RDF 位 于 XML 层 之 上 。 

RDF 模式 提供 了 将 万 维 网 对 象 组 织 为 层次 结构 的 建 模 原 语 。 重 要 的 原 语 包括 类 和 属性 ， 
子 类 和 子 属性 联系 ， 以 及 定义 域 和 值 域 约束 。RDF 模式 是 基于 RDF 的 。 

RDF 模式 可 以 被 认为 是 一 种 表达 本 体 的 基本 语言 。 但 是 还 需要 一 些 更 加 强大 的 本 体 语言 
(ontology language)， 它 们 扩展 RDF 模式 并 且 人 允许 表达 万 维 网 对 象 间 更 加 复杂 的 联系 。 逻 辑 层 
用 于 进一步 增强 本 体 语言 并 允许 描述 面向 特定 应 用 的 声明 式 知 识 。 

证 明 层 (proof layer) 包括 了 实际 的 演绎 过 程 ， 以 及 使 用 (更 低层 次 的 ) 万 维 网 语言 来 表 
达 证 明和 验证 证 明 。 

最 后 ， 信 任 层 ( trust layer) 将 伴随 使 用 数字 签名 ( digital signature) 和 知识 的 其 他 类 别 出 
现 ， 基 于 可 信 agent 的 推荐 或 者 基于 评分 和 证 书 中 介 及 消费 体 。 有 了 时,“ 信任 网 ”用 于 表示 信 
任 将 被 组 织 成 与 万 维 网 本 身 一 样 的 分 布 式 的 、 混 乱 的 方式 。 位 于 金字 塔 的 最 顶层 ， 信 任 是 一 
个 高 层 且 重要 的 概念 : 当 用 户 对 其 操作 (安全 性 ) 和 提供 的 信息 的 质量 信任 时 ， 万 维 网 才能 实 
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现 其 所 有 潜力 。 

经 典 的 分 层 蛋糕 是 语义 网 日 程 表 上 的 主要 驱动 力 ， 但 是 现在 已 经 相当 过 时 了 。 特 别 是 本 
体 词 汇 表层 的 许多 替代 者 已 经 出 现 。 另 外 规则 语言 已 被 定义 在 RDF 之 上 ， 绕 开 了 本 体 词 汇 表 
层 ， 这 特别 适用 于 最 近 从 丰富 的 语义 结构 向 大 规模 (语义 ) 数据 处 理 的 转变 。 因 此 这 里 给 出 的 
分 层 蛋 糕 主要 是 示例 的 目的 ， 作 为 展现 语义 网 历史 观点 的 一 种 方式 。 


1.4 本 书 内 容 安排 

在 这 本 书 中 ,我 们 关注 的 是 已 经 达到 一 个 合理 成 熟 度 的 语义 网 技术 。 

第 2 章 讨论 RDF 和 RDF 模式 。RDF 是 一 种 用 于 表达 有 关 对 象 (资源 ) 的 声明 的 语言 ; È 
是 一 个 标准 的 数据 模型 以 提供 机 器 可 处 理 的 语义 。RDF 模式 提供 了 一 组 用 于 将 RDF 词汇 表 组 
织 成 带 类 型 的 层次 结构 的 建 模 原 语 。 

第 3 章 致力 于 介绍 SPARQL 查询 语言 ， 它 在 RDF 领域 中 起 到 的 作用 与 SQL 在 关系 领域 
中 的 作用 相同 。 

第 4 章 讨 论 OWL2， 它 是 万 维 网 本 体 语 言 OWL 的 最 新 修订 版 。OWL2 提供 了 比 RDF 模 
式 更 多 的 建 模 原 语 ， 并 且 它 拥有 清晰 的 、 形 式 化 的 语义 。 | 

第 5 章 致力 于 介绍 语义 网 框架 中 的 规则 。 虽 然 语义 网 上 的 规则 还 尚未 达到 和 RDF 
SPARQL 或 OWL 相同 级 别 的 一 致意 见 ， 但 其 被 采用 的 原理 却 非常 清楚 ， 因 此 在 此 介绍 规则 
也 很 有 意义 。 

第 6 章 介 绍 一 些 应 用 领域 并 解释 语义 网 愿景 的 成 熟 所 带 来 的 好 处 。 

第 7 章 介 绍 有 关 为 万 维 网 开发 基于 本 体 的 系统 的 各 种 关键 问题 。 

第 8 章 简要 探讨 目前 语义 网 社区 中 正在 争论 的 一 些 话题 。 


15 ”小结 
。 语义 网 是 一 场 则 在 改进 当前 万 维 网 状况 的 运动 。 
。 其 核心 思想 是 机 器 可 处 理 的 万 维 网 信息 的 使 用 。 
e。 其 核心 技术 包括 发 布 带 有 显 式 元 数据 的 数据 、 本 体 、 逻 辑 和 推理 。 
。 语义 网 的 开发 是 分 层次 进行 的 。 
建议 阅读 
一 篇 有 关 语 义 网 愿景 的 优秀 介绍 性 论文 是 : 


e T. Berners-Lee, J. Hendler, and O. Lassila. The Semantic Web. Scientific American 284 (May 
2001): 34—43. 

一 本 有 关 万 维 网 历史 (和 未 来 ) 的 启发 性 图 书 是 : 

e T. Berners-Lee, with M. Fischetti. Weaving the Web. San Francisco: Harper, 1999. 

一 些 维护 有 关 语 义 网 及 相关 主题 最 新 信息 的 网 站 包括 : 
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2011. 

语义 网 上 最 重要 的 想法 、 技 术 和 应 用 最 新 进展 的 主要 发 表 之 处 是 : 
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© 系列 会 议 Extended (European) Semantic Web Conference, ÆJ http://www.eswe.org/. 

e 语义 网 杂志 。 参 见 http://www.journals.elsevier.com/journal-of-web-semantics/ s 

一 些 专注 于 语义 网 的 图 书 近 些 年 来 也 已 出 现 。 其 中 

e D. Allemang and J. Hendler. Semantic Web for the Working Ontologist: Effective Modeling 
in RDFS and OWL. New York, NY.: Morgan Kaufmann, 2008. 

侧重 于 本 体 建 模 问题 ， 而 

e P. Hitzler, M. Kroetzsch, and S. Rudolph. Foundations of Semantic Web Technologies. Boca 
Raton, FL.: Chapman and Hall, 2009. 

侧重 于 逻辑 基础 。 


第 2 章 | 


A Semantic Web Primer, Third Edition | 


描述 万 维 网 资源 : RDF 


2.1 引言 


万 维 网 的 成 功 展现 了 使 用 标准 化 的 信息 交换 和 通信 机 制 的 力量 。HTML 是 编辑 网 页 的 标 
准 语言 。 它 允许 任何 人 发 布 一 个 文档 并 且 相信 该 文档 可 以 被 任何 万 维 网 浏览 器 正确 呈现 。 
HTML 和 其 他 交换 语言 都 拥有 以 下 3 个 组 成 元 素 : 语法 、 数 据 模型 和 语义 。 语 法 告诉 我 
们 如 何 撰写 数据 。 数 据 模型 告诉 我 们 数据 的 结构 或 组 织 形式 。 语 义 告诉 我 们 如 何 解释 数据 . 
我 们 可 以 通过 下 面 的 HTML 片段 展现 上 述 每 个 组 成 元 素 : 
<html> 
<head> 


<title>Apartments for Rent</title> 


</head> 
<body> 
<ol> 


<li> Studio apartment on Florida Ave. 
<li> 3 bedroom Apartment on Baron Way 
</ol> 
</body> 

</html> 

HTML 的 语法 是 用 尖 括 号 撰写 的 带 标签 文本 (例如 <title>), HTML 的 数据 模型 称 为 
文档 对 象 模 型 (Document Object Model)， 将 由 标签 定义 的 元 素 组 织 成 一 个 层次 树 状 结构 。 例 
Wi, <head> 应 该 在 <body> 之 前 ， 而 <li> 元 素 应 该 包含 在 <ol> THA. BA, HTML 
的 语义 告诉 我 们 浏览 器 应 该 如 何 解释 网 页 。 例 如 ， 浏 览 器 应 该 将 网 页 体 的 内 容 呈 现在 浏览 器 
窗口 中 ， 同 时 <ol> 元 素 应 该 呈现 为 一 个 有 序列 表 。 语 法 、 数 据 模型 和 语义 都 在 HTML 标准 
中 定义 。 

HTML 用 于 传递 有 关 面 向 人 类 的 文档 结构 的 信息 。 而 对 于 语义 网 ， 我 们 的 需求 更 加 丰富 。 
我 们 需要 一 个 能 够 被 各 种 应 用 使 用 的 数据 模型 ， 不 仅 为 人 类 描述 文档 ， 而 且 为 特定 应 用 描述 
信息 。 这 个 数据 模型 需要 是 领域 无 关 (domain independent) 的 ， 因 此 从 房地产 到 社交 网 络 的 
应 用 都 可 以 使 用 它 。 除 了 一 个 灵活 的 数据 模型 之 外 ， 我 们 还 需要 一 种 机 制 来 将 语义 赋予 使 用 
这 个 数据 模型 表达 的 信息 。 它 应 该 允许 用 户 描述 一 个 应 用 该 如 何在 一 个 社交 网 络 描述 中 解释 
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“朋友 ”， 以 及 如 何在 一 个 地 理 信 息 描述 中 解释 “城市 ” 。 最 终 ， 和 HTML 类 似 ， 我 们 需要 将 
所 有 这 些 信息 写 下 来 ， 即 语法 。 

RDF (资源 描述 框架 ) 恰好 提供 了 这 样 一 个 灵活 并 且 领 域 无 关 的 数据 模型 。 它 的 基础 构件 
是 一 个 实体 -属性 (attribute ©) - 取 值 的 三 元 组 ， 称 为 声明 ( statement)。 例 如 ， 我 们 可 以 使 
用 这 个 模型 来 表达 “The Baron Way Apartment is an Apartment”, “The Baron Way Apartment is 
part of The Baron Way Building ”以 及 “ The Baron Way Building is located in Amsterdam”. [| 
为 RDF 不 针对 任何 领域 及 使 用 ， 对 用 户 而 言 必须 定义 他 们 在 这 些 声明 中 使 用 的 术语 。 为 此 ， 
需要 利用 RDF 模式 (RDFS)。RDFS 允许 用 户 精确 地 定义 它们 的 词汇 表 (vocabulary, HENI 
的 术语 ) 应 该 如 何 解 释 。 

综合 起 来 ， 这 些 技 术 定 义 了 在 不 同 机 器 间 交 换 任意 数据 的 一 种 标准 化 语言 的 组 成 部 分 : 

。 RDF 一 一 数据 模型 

e RDFS 语义 

e Turtle / RDFa/ RDF-XML 语法 

尽管 RDF 主要 是 指数 据 模型 ， 它 也 经 常 被 用 来 作为 上 述 所 有 的 总 称 ( 本 书 中 也 会 这 样 
使 用 )。 


。 2.2 节 介 绍 RDF. 

e 2.3 节 介 绍 RDF 使 用 的 各 种 语法 。 

。 2.4 节 介 绍 RDF 模式 的 基础 知识 ， 完 整 的 语言 将 在 2.5 节 和 2.6 节 中 介绍 。 
© 2.7 节 和 2.8 节 将 从 两 个 方面 介绍 RDFS 的 形式 化 含义 。 


2.2 RDF: 数据 模型 
RDF 中 的 基本 概念 包括 资源 、 属 性 、 声 明和 图 。 








2.2.1 资源 

我 们 可 以 认为 一 个 资源 是 一 个 对 象 ， 我 们 希望 谈论 的 一 个 “事物 ”。 资 源 可 以 是 作者 、 公 
寓 、 网 球 选手 、 地 点 、 人 、 旅 馆 、 查 询 ， 等 等 。 每 个 资源 都 有 一 个 URI。 一 个 URI 可 以 是 一 
个 URL ((Uniform Resource Locator， 统 一 资源 定位 符 )， 或 网 址 ) 或 者 另 一 种 唯一 的 标识 符 。 
URI 机 制 不 仅 被 定义 为 万 维 网 上 的 位 置 ， 还 可 以 是 电话 号 码 、ISBN 号 和 地 理 位 置 。URI 提 
供 了 一 种 机 制 来 无 歧义 地 标识 我 们 想 要 谈论 的 一 个 “事物 ”。 因 此 ， 如 果 想 指称 一 个 游泳 池 
(pool)， 我 们 可 以 为 其 分 配 一 个 URI, EAS ATER (billiard, pool 的 男 一 个 词义 ) 或 者 一 
群 程序 员 (the pool of programmers) 混淆 。 这 称 为 一 词 多 义 问题 。 

使 用 URI 不 必 能 访问 (access) 到 一 个 资源 。 但 是 使 用 可 以 解 引用 的 ( dereferenceable ) 
URL 作为 资源 标识 符 被 认为 是 一 种 好 的 做 法 。 它 使 得 用 户 既 可 以 获取 资源 本 身 (比如 一 张 图 


© 本 书 中 ，attribute 和 property 都 翻译 为 “属性 ”"， 通 常 可 根据 上 下 文 判断 。 在 可 能 引发 误解 的 地 方 ,“ 属 性 ” 
默认 指 的 是 property。 当 指 的 是 attribute 时 ， 会 在 括号 中 附加 英文 说 明 。 一 一 译 者 注 
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片 )， 也 可 以 获取 资源 的 进一步 描述 (比如 一 个 人 )。 这 种 做 法 将 贯穿 本 书 。 使 用 URI 是 RDF 
背后 的 一 个 关键 设计 方案 。 它 允许 全 球 唯一 的 命名 方案 的 存在 。 使 用 这 种 机 制 能 够 大 幅 缓解 
迄今 为 止 困扰 分 布 式 数据 表示 的 一 词 多 义 问题 。 


2.2.2 属性 

属性 是 一 类 特殊 的 资源 ， 它 们 描述 了 资源 之 则 的 关系 。 例 如 , “ friend of”, “ written by” 
All “located in”。 和 其 他 资源 一 样 ， 属 性 也 由 URI 标识 。 我 们 也 可 以 解 引 用 属性 的 URL 来 找 
到 它们 的 描述 。 
2.2.3 ”声明 

声明 断言 了 资源 的 属性 。 一 个 声明 是 一 个 实体 - 属性 (attribute) - 取 值 的 三 元 组 ， 由 一 
个 资源 、 一 个 属性 和 一 个 属性 值 组 成 。 属 性 值 要 么 是 一 个 资源 ， 要 么 是 一 个 文字 (literal), X 
字 是 原子 值 ， 例 如 ， 数 字 、 字 符 串 或 日 期 。 我 们 经 常 使 用 主语 一 词 来 指称 三 元 组 里 的 实体 ， 
而 使 用 宾语 来 指称 其 取 值 。 

例如 ， 对 于 声明 “Baron Way Building is located in Amsterdam”， 我 们 可 以 这 么 写 : 


<http://www.semanticwebprimer.org/ontology/apartments.ttl#BaronWayBuilding> 
<http://dbpedia.org/ontology/location> 
<http://dbpedia.org/resource/Amsterdam>. 


注意 ， 我 们 在 这 个 声明 中 如 何 使 用 URL 来 标识 我 们 指称 的 事物 。 
2.2.4 

我 们 也 可 以 使 用 图 形 化 的 方式 来 书写 相同 的 声明 。 注 意 ， 为 了 增加 可 读 性 ， 我 们 在 图 中 
不 使 用 URI。 

如 图 2-1 所 示 ， 人 带 标 签 的 节点 通过 带 标 签 的 边 连接 。 边 是 有 辐 的 ， 从 声明 的 主语 到 声明 
的 宾语 ， 声 明 的 属性 被 标记 在 边 上 。 节 点 上 的 标签 是 主语 和 宾语 的 标识 符 。 一 个 声明 的 宾语 
可 以 是 另 一 个 声明 的 主语 。 例 如 ， 我 们 可 以 说 “ Amsterdam is a city”。 我 们 可 以 在 图 2-2 中 
看 见 这 个 图 形 化 结果 。 


BaronWay 


Building Amsterdam 





图 2-1 一 个 图 形 化 表示 的 RDF 声明 


这 种 图 形 化 表示 强调 了 RDF 是 一 个 以 图 为 中 心 的 数据 模型 这 一 概念 。 事 实 上 ，RDF 和 人 
工 智能 领域 中 的 语义 网 络 (semantic net) 类 似 。 我 们 能 够 继续 扩展 有 关 Baron Way Building 信 
息 的 图 。 图 2-3 展示 了 RDF 图 的 一 个 扩展 版 本 。 
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BaronWay 
Building 


Amsterdam 





图 2-2 一 个 RDF 图 






Netherlands 





BaronWay 
Flat 


重要 的 是 ， 这 个 图 可 以 以 一 种 分 布 式 的 方式 ， 由 多 个 不 同 参与 人 使 用 相同 的 URL 来 创 


图 2-3 一 个 扩展 的 RDF 图 


建 。 这 使 得 我 们 可 以 创建 一 个 允许 知识 被 重用 的 数据 万 维 网 (Web of Data)。 例 如 ， 如 果 我 们 
在 万 维 网 上 发 现 描述 Amsterdam 的 RDF， 我们 可 以 仅 通 过 使 用 该 URL 来 重用 这 些 信息 。 事 
实 上 ， 有 一 组 称 为 链接 数据 原则 (Linked Data principle ©) 的 最 佳 实践 ， 鼓 励 我 们 重用 和 使 信 
息 可 用 来 帮助 创建 一 个 全 局 的 图 。 


1 ) 使 用 URI 作为 事物 的 名 称 。 

2) 使 用 HTTP URI， 以 便 人 们 可 以 查询 到 这 些 名 称 。 

3) 当 某 人 查询 一 个 URI 时 ， 使 用 标准 (RDF) 来 提供 有 用 的 信息 。 

4) 包含 到 其 他 URI 的 链接 ， 以 便 可 以 发 现 更 多 事物 。 

虽然 RDF 数据 模型 不 要 求 我 们 必须 遵循 这 些 原 则 ， 但 是 通过 这 样 做 可 以 使 我 们 从 他 人 贡 


献 的 知识 中 获 益 。 注 意 ， 在 该 例子 中 ， 我 们 已 经 重用 了 DBpedia.org 提供 的 信息 。 你 可 以 沿 着 
这 些 URL 来 发 现 更 多 关于 所 指称 的 概念 的 信息 。 


2.25 ”指向 声明 和 图 


有 时 能 够 指向 特定 的 声明 或 图 的 某 些 部 分 是 很 有 用 的 ， 例 如 当 赋 予 一 个 声明 一 个 信念 度 


http:/www.w3.org/Desginlssues/LinkedData.html。 
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时 ， 或 者 标识 一 个 声明 从 哪里 来 时 。 例 如 ， 我 们 可 能 想 要 描述 一 个 关于 Baron Way Building 
的 位 置 的 声明 是 由 一 个 叫 Frank 的 人 创建 的 。RDF 提供 了 两 种 实现 机 制 。 

一 种 称 为 具体 化 (reification)。 具 体 化 背后 的 关键 思想 是 引入 一 个 额外 的 对 象 ， 例 如 
LocationStatement， 并 将 它 和 原来 声明 中 的 三 个 部 分 通过 属性 subject. predicate 和 object X 
联 。 在 之 前 的 例子 中 ，LocationStatement HY) ih BaronWayBuilding, Witt location， 而 宾 
语 是 4msterdam。 随 后 我 们 可 以 将 这 个 声明 作为 男 一 个 三 元 组 的 主语 来 定义 创建 者 。 图 2-4 Hi 
述 了 生成 的 结果 图 。 同 样 出 于 展示 的 原因 ， 完 整 的 UR 没有 在 图 2-4 中 给 出 。 






Amsterdam 


这 种 相对 笨重 的 方式 是 必要 的 ， 因 为 RDF 中 只 存在 三 元 组 ， 因 此 我 们 不 能 直接 为 三 元 组 
添加 一 个 标识 符 (否则 就 变 成 了 四 元 组 )。 正 是 由 于 具体 化 的 昂贵 代价 ， 在 较 新 版 本 的 RDF 
标准 中 引入 了 命名 图 的 概念 。 这 时 ,一 个 显 式 的 标识 符 (同样 是 URL) 被 赋予 一 个 声明 或 声 
明 集 合 。 然 后 这 个 标识 符 就 可 以 在 普通 的 三 元 组 中 引用 。 这 是 一 种 更 加 直接 地 定义 声明 和 图 
的 机 制 。 简 言 之 ， 一 个 命名 图 允许 圈 出 一 个 RDF 声明 的 集合 并 为 这 些 声明 提供 一 个 标识 符 。 
2.3.1 节 第 一 部 分 内 容 提 供 了 一 个 使 用 命名 图 来 表示 上 述 具 体 化 声明 的 例子 。 


图 2-4 一 个 具体 化 的 例子 


2.2.6 ”处 理 更 丰富 的 谓语 

我 们 可 以 将 一 个 三 元 组 (x, P, y) 想 成 一 个 逻辑 公式 P(x, y)， 其 中 二 元 谓词 关联 对 象 x 
到 对 象 y。 事 实 上 RDF 只 提供 了 二 元 谓词 (属性)。 但 是 在 一 些 情况 下 ,我们 可 能 需要 谓语 包 
含 超过 两 个 参数 。 幸 运 的 是 ， 这 样 的 谓语 可 以 通过 一 组 二 元 谓词 来 模拟 。 我 们 通过 一 个 包含 
3 个 参数 的 谓语 broker 来 展现 这 个 技术 。broker(X,Y,Z) 的 直观 含义 是 

XX 是 房屋 出 售 人 了 Y 和 购买 人 Z 之 间 的 中 介 。 

现在 介绍 一 个 新 的 额外 的 资源 home-sale 以 及 二 元 谓词 broker, seller 和 purchaser。 接 下 
来 ， 可 以 将 broker(X, Y, Z) 表达 为 如 下 形式 : 


broker(home-sale, X) 
seller(home-sale, Y) 


purchaser(home-sale, Z) 


| 30 | 
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虽然 拥有 3 个 参数 的 谓语 书写 更 简洁 ， 使 用 二 元 谓词 确实 简化 了 整个 数据 模型 。 


2.3 RDF 语法 


我 们 已 经 看 到 了 一 种 RDF 语法 ， 即 图 形 化 的 语法 。 但 是 这 种 语法 既 不 是 机 器 可 解释 的 ， 
也 不 是 标准 化 的 。 本 节 介 绍 一 种 标准 的 机 器 可 解释 的 语法 ， 称 为 Turtle， 男 外 还 将 简要 介绍 一 
些 其 他 语法 。 


2.3.1 Turtle 


Turtle ( Terse RDF Triple Language) 是 一 种 基于 文本 的 RDF 语法 。Turtle 文本 文件 使 用 的 
后 级 名 是 “ .ttl”。 我们 之 前 已 经 见 到 如 何 使 用 Turtle 写 一 个 声明 。 下 面 是 一 个 例子 : 


<http://www.semanticwebprimer.org/ontology/apartments.ttl#BaronWayBuilding> 
<http://dbpedia.org/ontology/location> 


<http://dbpedia.org/resource/Amsterdam>. 


URL 包含 在 尖 括号 中 。 一 个 声明 的 主语 、 属 性 和 宾语 依次 出 现 ， 由 句号 结尾 。 事 实 上 ， 
我 们 能 够 仅 使 用 这 种 方法 来 编写 整个 RDF 图 。 


<http://www.semanticwebprimer.org/ontology/apartments.ttl## > 
<http://www.semanticwebprimer.org/ontology/apartments.ttl#isPartOf> 
<http://www.semanticwebprimer.org/ontology/apartments.ttl#BaronWayBuilding>. 

<http://www.semanticwebprimer.org/ontology/apartments.ttl#BaronWayBuilding> 
<http://dbpedia.org/ontology/location> 


<http://dbpedia.org/resource/Amsterdam>. 

1. 文字 

到 目前 为 止 ， 我 们 已 经 定义 了 将 资源 链接 在 一 起 的 声明 。 正 如 之 前 讨论 的 那样 ， 我 们 也 
能 在 RDF 中 引入 文字 ， 即 原子 值 。 在 Turtle 中 ， 我 们 简单 地 将 值 写 在 引号 中 ， 并 附 上 值 的 数 
据 类 型 。 数 据 类 型 告诉 我 们 是 否 应 该 将 一 个 值 解释 为 字符 串 、 日 期 、 整 型 数 ， 还 是 其 他 类 型 。 
数据 类 型 也 使 用 URL 表达 。 实 践 中 建议 使 用 XML 模式 定义 的 数据 类 型 。 当 使 用 这 些 数 据 类 
型 时 ， 值 必须 服从 XML 模式 定义 。 如 果 一 个 文字 之 后 没有 指定 数据 类 型 ， 则 假设 数据 类 型 
是 字符 型 。 下 面 是 一 些 常见 的 数据 类 型 以 及 它们 在 Turtle 中 的 形式 : 


string -“Baron Way" 

integers - "1" *<http://www.w3.org/2001/XMLSchema#integer> 
decimals - ''1.23"' <http://www.w3.org/2001/XMLSchema#decimal> 
dates - ''1982-08-30"'* *<http://www.w3.org/2001/XMLSchema#date> 
time - ''11:24:00''* *<http://www.w3.org/2001/XMLSchema#time> 
date with a time - 


“1982-08-30T 11:24:00" ^ ^ <http://www.w3.org/2001/XMLSchema#dateTime> 


假设 我 们 想 要 向 图 中 添加 Baron Way Apartment 有 3 个 房间 。 可 以 将 下 面 Turtle 中 的 声明 
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添加 到 图 中 。 


<http://www.semanticwebprimer.org/ontology /apartments.ttl#BaronWayApartment> 
<http://www.semanticwebprimer.org/ontology/apartments.ttl#hasNumberOfBedrooms> 


"3" ^^ <http://www.w3.org/2001/XMLSchema#integer>. 


<http://www.semanticwebprimer.org/ontology/apartments.ttl#BaronWayApartment> 
<http://www.semanticwebprimer.org/ontology/apartments.ttl#isPartOf> 


<http://www.semanticwebprimer.org/ontology/apartments.ttl#BaronWayBuilding>. 


<http: //www.semanticwebprimer.org/ontology/apartments. ttl##BaronWayBuilding> 

<http://dbpedia.org/ontology/location> 

<http://dbpedia.org/resource/Amsterdam>. 

上 上述 例子 相对 而 言 不 容易 使 用 。 为 使 其 更 加 清晰 ，Turtle 提供 了 一 些 构造 子 来 使 书写 变 得 
更 加 容易 。 


2. 缩写 

当 我 们 定义 词汇 表 时 ， 我 们 经常 在 相同 的 URI 上 定义 。 在 例子 中 ， 资 源 Baron Way 
Apartment 和 Baron Way Building 都 定 X 在 T http://www.semanticwebprimer.org/ontology/ 
apartments.ttl 这 个 URL 下 。 这 个 URL 定义 了 这 些 资源 的 命名 空间 (namespace)。Turtle 使 用 
了 这 个 惯例 ， 允 许 URL 被 缩写 。 它 引入 了 @prefix 语法 来 定义 特定 命名 空间 的 替代 形式 。 例 
如 ， 可 以 用 swp 作为 http:/www.semanticwebprimer.org/ontology/apartment.ttl 的 替代 形式 。 这 
种 替代 称 为 限定 名 (qualified name), LAF HARES TAT. 


@prefix swp: <http: //www.semanticwebprimer.org/ontology/apartments.ttl#>. 
@prefix dbpedia: <http://dbpedia.org/resource/>. 

@prefix dbpedia-owl: <http://dbpedia.org/ontology/>. 

@prefix xsd: <http://www.w3.org/2001/XMLSchema#>. 


swo:BaronWayApartment swp:hasNumberOfBedrooms "3"* ~<xsd:integer>; 

swp: Baron WayApartment: swp:lePartOF swp:BaronWayBullding. 

swp: BaronWayBuilding dbpedia-owl:location dbpedia:Amsterdam. 

注意 ， 使 用 限定 名 来 指称 资源 时 ， 资 源 两 侧 的 尖 括 号 被 去 掉 了 。 其 次 ， 我 们 能 够 混用 这 
些 限定 名 与 常规 URL 并 匹配 它们 。 

Turtle 还 允许 在 我 们 重复 使 用 某 些 主语 的 时 候 不 需要 再 重复 书写 。 在 上 面 的 例子 中 ， 
swp:BaronWayApartment 被 用 作 两 个 三 元 组 的 主语 。 这 可 以 通过 在 一 个 声明 的 结尾 处 使 
用 一 个 分 号 来 使 书写 更 加 紧凑 。 例 如 : 
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@prefix swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 
@prefix dbpedia: <http://dbpedia.org/resource/>. 

@prefix dbpedia-owl: <http://dbpedia.org/ontology/>. 

@prefix xsd: = <http://www.w3.org/2001/XMLSchema#>. 


swp:BaronWayApartment swp:hasNumberOfBedrooms "3" ^^ <xsd:integer>; 
swp:isPartOf swp:BaronWayBuilding. 


swp:BaronWayBuilding dbpedia-owl:location dbpedia:Amsterdam. 


如 果 主 语 和 谓语 都 被 重复 使 用 ,我 们 可 以 在 声明 的 结尾 处 使 用 一 个 逗号 。 例 如 ， 如 果 希 


望 扩 展 该 例子 ， 说明 Baron Way Building 不 仅 位 于 Amsterdam 还 位 于 Netherlands， 可 以 在 
Turtle 中 这 样 写 : 


@prefix swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl# >. 
@prefix dbpedia: <http://dbpedia.org/resource/>. 

@prefix dbpedia-owl: <http://dbpedia.org/ontology/>. 

@prefix xsd: ~ <http://www.w3.org/2001/XMLSchema#>. 


swp:BaronWayApartment swp:hasNumberOfBedrooms "3"* *<xsd:integer>; 


swp:isPartOf swp:BaronWayBuilding. 


swp:BaronWayBuilding dbpedia-owl:location dbpedia:Amsterdam, 
dbpedia:Netherlands. 


最 后 ，Turtle 允许 我 们 简写 常见 的 数据 类 型 。 例 如 ， 数 字 可 以 不 使 用 引号 来 写 。 如 果 数 字 


包含 一 个 小 数 点 (例如 14.3 )， 那 么 它们 就 被 解释 为 小 数 。 如 果 它 们 不 包含 一 个 小 数 点 (例如 
1 )， 那 么 它们 就 被 解释 成 整 型 数 。 这 更 加 简化 了 该 例子 : 


[35] 概 


@prefix swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 
@prefix dbpedia: <http://dbpedia.org/resource/>. 
@prefix dbpedia-owl: <http://dbpedia.org/ontology/>. 


swp:BaronWayApartment swp:hasNumberOfBedrooms 3; 
swp:isPartOf swp:BaronWayBuilding. 
swp:BaronWayBuilding dbpedia-owl:location dbpedia:Amsterdam, 
dbpedia:Netherlands. 


3. 命名 图 
我 们 之 前 讨论 了 指向 一 组 声明 的 能 力 。Trig 是 Turtle 的 一 个 扩展 ， 它 允许 我 们 表达 这 个 


念 。 人 例如， 我们 可 能 想 说 ， 关 于 Baron Way Apartment 的 声明 是 由 一 个 叫 Frank 的 人 创建 
的 ， 


他 通过 http://www.cs.vu.nl/~frankh 来 标识 。 为 了 实现 它 ， 我 们 将 一 组 想 要 的 声明 用 人 花 括 


号 括 起 来 并 赋予 这 组 声明 一 个 URL。 让 我 们 看 下 面 的 例子 : 
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@prefix swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl#> 
@prefix dbpedia: <http://dbpedia.org/resource/>. 
@prefix dbpedia-owl: <http://dbpedia.org/ontology/>. 


@prefix dc: <http://purl.org/dc/terms/>. 


<http://www.semanticwebprimer.org/ontology/apartments.ttl# > 


de:creator <http://www.cs.vu.nl/ frankh> 


<http://www.semanticwebprimer.org/ontology/apartments.ttl#> 


{ 
swp:BaronWayApartment swp:hasNumberOfBedrooms 3; 
swp:isPartOf swp:BaronWayBuilding. 
swp:BaronWayBuilding dbpedia-owl:location dbpedia:Amsterdam, 
dbpedia:Netherlands. 
} 


在 这 个 方法 中 ， 位 于 花 括 号 中 但 是 之 前 没有 URL 的 声明 不 是 一 个 特定 图 的 一 部 分 。 它 称 
为 默认 图 。 
2.3.2 ”其 他 语法 
除了 Turtle 之 外 ， 还 存在 其 他 一 些 可 用 于 编写 RDF 的 语法 。 其 中 有 两 个 标准 的 语法 : 
RDF/XML 和 RDFa. 
1. RDF/XML 
RDF/XML 是 RDF 在 XML 诸 言 中 的 编码 。 它 允许 RDF 被 已 有 XML 处 理工 具 使 
用 。 起 初 ，RDF/XML 是 RDF 的 唯一 语法 。 但 是 ， 由 于 Turtle 通常 更 容易 阅读 ， 所 以 作 
为 一 种 额外 标准 被 采纳 。 下 面 展 示 了 一 个 RDF/XML。 主 语 在 一 个 rdf:Description 
元 素 中 通过 rdf:about 定义 (包含 在 尖 插 号 内 )。 与 主语 关联 的 谓语 和 宾语 也 包含 在 
rdf:Description 元 素 中 。 命 名 空间 可 以 通过 XML 命名 空间 结构 (xmlns: ) 被 使 用 。 所 
有 的 RDF/XML 必须 被 包含 在 一 个 rdf :RDF 元 素 中 。 
<?xml version="1.0" encoding="utf-8"?> 
<rdf:RDF xmlIns:dbpedia-owl="http: / /dbpedia.org/ontology/" 
xmIns:dbpedia="http://dbpedia.org/resource/" 
xmins:rdf="http: / /www.w3.org/1999/02/22-rdf-syntax-ns#" 
xmins:swp="http://www.semanticwebprimer.org/ontology/apartments.ttl#"> 
<rdf:Description 


rdf:about="http: / /www.semanticwebprimer.org/ontology/apartments.ttl#BaronWayApartment" > 


<swp:hasNumberOfBedrooms 
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来 帮 
Way 


rdf:datatype="http://www.w3.org/2001/XMLSchema#integer" > 
3 
</swp:hasNumberOfBedrooms> 
</rdf:Description> 
<rdf:Description 
rdf:about="http: / /www.semanticwebprimer.org/ontology /apartments.ttl#BaronWayApartment" > 
<swp:isPartOf 
rdf:resource="http:/ /www.semanticwebprimer.org /ontology/apartments.ttl#BaronWayBuilding" /> 
</rdf:Description> 
<rdf:Description 
rdf:about="http://www.semanticwebprimer.org/ontology/apartments.ttl#BaronWayBuilding" > 


<dbpedia-owl:location 
rdf:resource="http:/ /dbpedia.org/resource/Amsterdam" /> 


</rdf:Description> 
<rdf:Description 
rdf:about="http:/ /www.semanticwebprimer.org/ontology /apartments.ttl#BaronWayBuilding" 
<dbpedia-owl:location 
rdf:resource="http://dbpedia.org/resource/Netherlands" /> 
</rdf:Description> 
</rdf:RDF> 


2. RDFa 


RDF 的 一 个 用 例 是 描述 或 标注 HTML 网 页 的 内 容 。 为 了 使 其 更 加 简单 ， 引 入 RDFa 语法 





助 实现 这 个 用 例 。RDFa 在 HTML 标签 的 属性 (attribute) PEA RDF。 我 们 使 用 Baron 
Apartment 的 一 个 广告 作为 例子 。 

<html> 

<body> 


<H1> Baron Way Apartment for Sale</H1> 

The Baron Way Apartment has three bedrooms and is located in the fam- 
ily friendly Baron Way Building. The Apartment is located in the north of Amsterdam. 
</body> 


</html> 
这 个 页 面 并 不 包含 任何 机 器 可 读 的 描述 。 可 以 使 用 如 下 RDFa 来 标注 这 个 页 面 : 


<html xmins:dbpedia="http://dbpedia.org/resource/" 
xmins:dbpediaowl="http://dbpedia.org/ontology/" 
xmins:swp="http://www.semanticwebprimer.org/ontology /apartments.ttl#" 
xmins:geo="http://www.geonames.org/ontology#" > 


<body> 


<H1> Baron Way Flat for Sale</H1> 


HEZ HHH: RDF 23 





<div about="[swp:BaronWayFlat]"> 
The Baron Way Flat has <span property="swp:hasNumberOfBedrooms" >3</span> bed- 
rooms and is located in the family friendly <span _ rel="swp:isPartOf" re- 


source="[swp:BaronWayBuilding]">Baron Way Building</span> 


<div about="[swp:BaronWayBuilding]"> 

The building is located in the north of Amsterdam. 
<span rel="dbpediaowl:location" resource="[dbpedia:Amsterdam]"></span> 
<span rel="dbpediaowl:location" resource="[dbpedia:Netherlands]"></span> 


</div> 


</div> 

</body> 

</html> 

这 个 标注 将 生成 和 之 前 Turtle 表示 的 完全 一 样 的 RDF。 因 为 RDF 被 编码 在 诸如 span, 
paragraph 和 link 之 类 的 标签 中 ， 所 以 在 显示 HTML 页 面 时 不 会 被 浏览 器 解析 。 和 RDF/XML 
类 似 ， 命 名 空间 使 用 xmlns 声明 来 编码 。 一 些 情况 下 ， 必 须 使 用 方 括号 来 告诉 解析 器 我 们 
正在 使 用 前 级 。 主 语 通过 about JAY (attribute) 来 标识 。 属 性 通过 rel 或 property 属性 
(attribute) 来 标识 。 当 一 个 声明 的 宾语 是 一 个 资源 时 使 用 rel， 而 当 一 个 声明 的 宾语 是 文字 时 
使 用 property。 谓 语 和 主语 通过 使 用 HTML 层次 结构 来 关联 。 

上 述 每 种 RDF 语法 适用 于 不 同 的 场景 。 然 而 必须 意识 到 尽管 可 能 会 使 用 不 同 的 语法 ， 但 
它们 的 底层 数据 模型 和 语义 是 相同 的 。 迄 今 为 止 我 们 已 经 讨论 了 如 何 通 过 URL 标识 来 编写 事 
物 的 声明 。 但 是 这 些 声明 的 含义 是 什么 ? 一 个 计算 机 应 该 如 何 解释 这 些 生成 的 声明 ” 这 些 问 
题 将 在 下 一 节 介 绍 RDF 的 模式 语言 时 讨论 。 


2.4 RDFS: 添加 语义 

RDF 是 一 种 通用 语言 ， 它 允许 用 户 使 用 他 们 自己 的 词汇 表 来 描述 资源 。RDF 既 不 假设 与 
任何 特定 应 用 领域 有 关 ， 也 不 定义 任何 领域 的 语义 。 为 了 指明 语义 ,一 个 开发 者 或 用 户 需要 
通过 RDF 模式 中 定义 的 一 组 基本 的 领域 无 关 的 结构 来 定义 其 词汇 表 的 含义 。 


2.4.1 类 和 属性 

如 何 描述 一 个 特定 领域 ?让 我 们 考虑 一 下 公寓 租赁 领域 。 首 先 我 们 必须 指定 想 描述 的 
“事物 ”。 这 里 首先 做 一 个 基本 区 分 。 一 方面 ， 我 们 希望 描述 特定 的 公寓 ， 例 如 Baron Way 
Apartment， 以 及 特定 的 地 点 ， 例 如 Amsterdam， 这 些 之 前 已 经 在 RDF 中 完成 了 。 

另 一 方面 ; 我 们 还 想 描 述 公寓 、 建 筑 、 国 家 、 城 市 ， 等 等 。 区 别 是 什么 ? 第 一 种 情况 中 
我 们 描述 的 是 个 体 对 象 (individual object， 资 源 )， 而 第 二 种 情况 中 我 们 描述 的 是 类 (class), 
它们 定义 了 对 象 的 类 型 。 


24 2# 





一 个 类 可 以 被 理解 为 一 个 元 素 集合 。 属 于 一 个 类 的 个 体 对 象 称 为 该 类 的 实例 (instance). 
RDF 给 我 们 提供 了 一 种 通过 使 用 一 个 特殊 属性 rdf: type 来 定义 实例 和 类 之 间 联 系 的 方式 。 

类 的 一 个 重要 用 法 是 ， 施 加 限制 来 约束 在 一 个 RDF 文档 中 使 用 模式 可 以 声明 什么 。 在 编 
程 语言 中 ， 类 型 定义 (typing) 用 来 阻止 无 意义 的 编程 (例如 4+1， 其 中 4 是 一 个 数组 ， 而 我 
们 要 求 “+” 的 参数 必须 是 数字 )。RDF 中 也 需要 相同 的 功能 。 之 后 ,我 们 可 能 会 不 允许 如 下 
声明 : 


Baron Way Apartment rents Jeff Meyer 


Amsterdam has number of bedrooms 3 


第 一 个 声明 是 无 意义 的 ， 因 为 建筑 不 能 出 租 人 。 这 在 属性 “rents” 的 取 值 上 施加 了 限制 。 
用 数学 语言 来 说 ,我 们 限制 了 属性 的 值 域 (range)。 

第 二 个 声明 也 是 无 意义 的 ， 因 为 城市 不 能 拥有 房间 。 这 在 可 以 应 用 属性 的 对 象 上 施加 了 
限制 。 用 数学 语言 来 说 ， 我 们 限制 了 属性 的 定义 域 (domain). 


2.4.2 ”类 层次 和 继承 
一 旦 有 了 类 ， 我 们 就 希望 建立 它们 之 间 的 联系 。 例 如 ,假设 已 经 有 了 如 下 类 : 
unit 
residential unit commercial unit 


house& apartment office 


这 些 类 不 是 互 不 关联 的 。 例 如 ， 每 个 residential unit (居住 单元 ) 都 是 一 个 unit。 我 们 称 
“residential unit” 是 “unit” 的 一 个 子 类 (subclass)， 或 等 价 地 说 “unit” 是 “residential unit” 
的 一 个 超 类 (superclass)。 子 类 联系 定义 了 类 的 一 个 层次 ， 如 图 2-5 所 示 。 通 常 ， 如 果 4 的 每 
个 实例 也 是 8 的 实例 ， 则 4 是 8 TFX, RDF 模式 不 要 求 所 有 的 类 形成 一 个 严格 的 层次 结构 . 
换 名 话说， 图 2-5 所 示 的 一 个 子 类 图 不 必 是 一 棵 树 。 一 个 类 可 能 有 多 个 超 类 。 如 果 一 个 类 4 
同时 是 B, 和 B, 的 子 类 ， 这 简单 意味 着 4 的 每 个 实例 同时 是 B, 的 实例 和 B 的 实例 。 

类 的 一 个 层次 化 组 织 拥 有 非常 重要 的 现实 意义 ,我 们 在 这 里 概述 。 考 虑 值 域 限制 


People can only rent residential units. 


假设 Baron Way Apartment 被 定义 为 一 个 apartment。 接 下 来 ， 根 据 前 面 的 限制 ， 它 并 没 
有 被 限定 为 是 一 个 residential unit， 因 为 不 存在 一 个 声明 来 指定 Baron Way Apartment 也 是 一 
个 residential unit。 通 过 为 描述 添加 上 述 声 明 来 解决 这 个 问题 不 符合 直觉 想象 。 相 反 ， 我 们 希 
望 Baron Way Apartment 继承 (inherit) residential unit 允许 被 出 租 的 能 力 。 这 正 是 RDF 模式 所 
做 的 。 

通过 这 样 做 ，RDF 模式 修复 了 “is a subclass of” 的 语义 。 现 在 不 是 根据 应 用 来 解释 “is 
a subclass of ”， 而 是 它 的 特定 含义 必须 被 所 有 RDF 处 理 软 件 所 使 用 。 通 过 创建 这 样 的 语义 定 
义 ，RDFS 是 一 种 (能 力 依然 受 限 的 ) 定义 特定 领域 语义 的 语言 。 换 名 话说 ，RDF 模式 是 一 种 
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图 2-5 一 个 类 的 层次 
当然 ， 类、 继承 和 属性 也 常见 于 计算 的 其 他 领域 中 
的 属性 。 为 一 个 类 添加 新 的 属性 意味 着 修改 这 个 类 


| 
站 
有 很 多 相似 性 ， 也 存在 许多 不 同 之 处 。 在 面向 对 象 编 程 中 ， 
添 性 意 
但 是 在 RDFS 中 ， 属 性 是 全 局 定义 的 。 


声明 


例如 在 面向 对 象 编程 中 。 但 是 尽管 
一 个 对 象 类 定义 了 可 以 应 用 于 它 
也 就 是 说 ， 它 们 没有 作为 属性 (attribute) 被 封装 
在 类 定义 中 。 可 以 在 一 个 已 有 的 类 上 定义 应 用 的 新 属性 ， 而 不 需要 修改 这 个 类 。 
一 方面 ， 这 是 一 个 后 果 深 远 的 有 力 机 制 : 我 们 可 以 使 用 他 人 定义 的 类 ， 并 通过 新 的 属性 
来 调整 它们 以 适合 我 们 的 需求 。 另 一 方面 ， 属 性 的 处 理 方式 脱离 了 源 自 建 模 和 面向 对 象 编程 
领域 中 的 标准 做 法 。 它 是 RDF/RDFS 中 的 一 个 特有 特征 。 
2.4.3 ”属性 层次 
我 们 已 经 看 » ALL Fay, 
rents” 4 “resident at” 的 子 属性 ( subproperty ) 。 
也 居住 在 r。 相 反 的 关系 则 不 成 立 。 例 如 , 疡 可 能 是 
p 可 能 只 是 


2.4.4 RDF 和 RDFS 的 分 层 对 比 


可 以 定义 类 之 间 的 层次 联系 。 属 性 间 也 可 以 采用 相同 的 方式 。 例 如 


I\o 
如 果 一 个 人 p 租 了 一 个 居住 单元 rx,， 则 p 


| 
总 之 ， 某 个 属性 E 0 的 子 属性 ， 仅 当 P(x, y) 成 立时 O(x,y) 总 成 立 。 
最 后 ， 我 们 使 用 一 个 简单 的 例子 来 说 明 RDF 和 RDFS 涉及 的 不 同 分 层 


这 个 声明 的 模式 可 能 包含 人 、 


i 
一 个 家 庭 中 的 儿童 ,，p 不 支付 租金 ,或 者 
Jeff Meyer rents the Baron Way Apartment 


图 2-6 展现 了 这 个 例子 的 RDF 层次 和 RDF 模式 层次 
是 类 ， 而 虚线 以 下 的 圆圈 是 实例 


考虑 下 面 的 RDF 


公寓 、 房 屋 、 单 元 等 类 ， 以 及 出 租 、 居 住 在 、 地 址 等 属性 。 


其 中 ， 方 块 是 属性 ， 虚 线 以 上 的 圆圈 
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图 2-6 中 的 模式 本 身 也 使 用 一 种 形式 语言 ( RDF 模式 ) 来 编写 ， 可 以 表达 的 组 成 元 素 有 : 
subClassOf, Class, Property, subPropertyOf, Resource 等 。 接 下 来 我 们 将 更 
详细 地 介绍 RDF 模式 。 








subPropertyOf 
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图 2-6 RDF 层 和 RDFS 层 
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2.5 RDF 模式: 语言 
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; RDF 模式 提供 建 模 原 语 来 表达 2.5 节 中 的 信息 。 一 个 必须 做 的 决定 是 使 用 什么 样 的 形式 
SU GA. GU RDF 本 身 并 不 让 人 吃惊 : RDF 模式 的 建 模 原 语 使 用 资源 和 属性 定义 。 通 过 观察 
图 2-6 可 以 验证 这 个 决定 。 我 们 将 这 个 图 表达 为 一 个 类 / 属性 的 层次 以 及 实例 ， 但 是 它 本 身 
当然 也 仅仅 是 一 个 带 标签 的 图 ， 可 以 用 RDF 编码 。 记 住 RDF 允许 表达 有 关 任 何 资源 的 声明 ， 
并 且 任 何 拥 有 URI 的 事物 都 可 以 作为 资源 。 因 此 ， 如 果 想 让 类 “apartment” 是 “residential 
unit” 的 一 个 子 类 ， 我 们 可 能 会 
1) A apartment, residential unit 和 subclassof 定义 所 需 的 资源 ; 
2) 定义 subclassof 为 一 个 属性 ; 
3 ) 编写 三 元 租 (apartment subClassOf residential unit), 
所 有 这 些 步骤 都 包含 在 RDF 的 表达 能 力 中 。 因 此 ， 一 个 RDFS 文档 仅仅 是 一 个 RDF X 
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档 ， 而 我 们 可 以 使 用 某 种 RDF 标准 语法 来 编写 。 
现在 ,我 们 定义 RDF 模式 的 建 模 原 语 。 


2.5.1 核心 类 
核心 类 包括 : 
rdfs:Resource， 所 有 资源 的 类 。 
rdfs:Class， 所 有 类 的 类 。 
rdfs:Literal， 所 有 文字 (字符 串 ) 的 类 。 
rdf:PropertYy， 所 有 属性 的 类 。 
rdf:Statement， 所 有 具体 化 声明 的 类 。 


2.5.2 ”定义 联系 的 核心 属性 

用 来 定义 联系 的 核心 属性 包括 : 

rdf:type, 将 一 个 资源 关联 到 它 的 类 (参见 2.4.1 节 )。 该 资源 被 声明 为 该 类 的 一 个 实例 。 

rdfs:subClassof， 将 一 个 类 关联 到 它 的 超 类 。 一 个 类 的 所 有 实例 都 是 它 的 超 类 的 实 
例 。 注 意 ,一 个 类 可 能 是 多 个 类 的 子 类 。 例如， 类 femaleProfessor 可 能 同时 是 female 
和 professor 的 子 类 。 

rdfs:subProperty0f, 将 一 个 属性 关联 到 它 超 属 性 中 的 一 个 。 

这 里 有 一 个 例子 ， 表达 了 所 有 的 公寓 都 是 居住 单元 : 


swp:apartment refs:subClassOf swp:ResidentialUnit 


注意 ，rdfs:subClassOf Ml rdfs:subPropertyOf 被 定义 为 传递 的 。 并 且 很 有 趣 的 是 ， 
rdfs:Class 是 rdfs:Resource 的 一 个 子 类 (所 有 的 类 都 是 资源 )， 同 时 rdfs:Resource 
是 rdfs:Class 的 一 个 实例 (rdfs:Resource 是 所 有 资源 的 类 ， 因 此 它 是 一 个 类 ! ) 出 于 
同样 的 原因 ， 每 个 类 都 是 rdfs :class 的 实例 。 


2.5.3 ”限制 属性 的 核心 属性 

用 来 限制 属性 的 核心 属性 包括 : 

rdfs:domain， 指 定 一 个 属性 PP 的 定义 域 ， 声明 任何 拥有 某 个 给 定 属性 的 资源 是 定义 
域 类 的 一 个 实例 。 

rdfs:range， 指 定 一 个 属性 P 的 值 域 ， 声明 一 个 属性 的 取 值 是 值 域 类 的 实例 。 

这 里 有 一 个 例子 声明 当 任 何 资源 有 一 个 地 址 时 ， 它 (通过 推理 ) 是 一 个 单元 并 且 取 值 是 一 
个 文字 : 


swp:address rdfs:domain swp:Unit. 


swp:address refs:range rdf:Literal. 


2.5.4 ”对 具体 化 有 用 的 属性 
下 面 是 一 些 对 具体 化 有 用 的 属性 : 
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rdf:subject， 将 一 个 具体 化 声明 关联 到 它 的 主语 。 
rdf:predicate,， 将 一 个 具体 化 声明 关联 到 它 的 谓语 。 
rdf:object, 将 一 个 具体 化 属性 关联 到 它 的 宾语 。 


2.5.5 ”容器 类 
RDF 还 允许 用 一 个 标准 的 方式 表达 容 右 。 可 以 表达 包 、 序 列 或 选择 。 
rdf :Bag, 包 的 类 。 
rdf:Seq, 序列 的 类 。 
rdf :Alt， 选 择 的 类 。 
rdfs:Container， 所 有 容器 类 的 超 类 ， 包 括 前 面 提 到 的 3 种 。 


2.5.6 ”效用 属性 

一 个 资源 可 以 在 万 维 网 上 的 许多 地 方 被 定义 和 描述 。 下 列 属性 允许 我 们 定义 链接 到 这 些 
地 址 : 

rdfs:seeAlso, 将 一 个 资源 关联 到 男 一 个 解释 它 的 资源 。 

rdfs:isDefinedBy， 它 是 rdfs:seeAlso 的 一 个 子 属性 ,将 一 个 资源 关联 到 它 的 定 
义 之 处 ， 一般 是 一 个 RDF 模式 。 

为 人 类 读者 提供 更 多 的 信息 常常 很 有 用 。 这 可 以 通过 以 下 属性 来 实现 : 

rdfs:comment, 注释 ,一 般 是 长 的 文本 ,可 以 与 一 个 资源 关联 。 

rdfs:label, 将 一 个 人 类 友好 的 标签 (名 字 ) 与 一 个 资源 关联 。 其 中 的 一 个 目的 是 用 作 
RDF 文档 的 图 形 化 表示 中 节点 的 名 称 。 


2.5.7 示例 : 住房 供给 
我 们 展示 一 个 住房 供给 的 例子 ， 并 提供 该 领域 的 概念 模型 ， 即 一 个 本 体 。 


@prefix swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>. 
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>. 


swp:Person rdf:type rdfs:Class. 


swp:Person rdfs:comment "The class of people". 


swp:Unit rdf:type rdfs:Class. 
swp:Unit rdfs:comment "A self-contained section of accommodations 


in a larger building or group of buildings." . 


swp:ResidentialUnit rdf:type rdfs:Class. 
swp:ResidentialUnit rdfs:subClassOf swp: Unit. 


swp:ResidentialUnit 
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rdfs:comment "The class of all units or places where people live.". 


swp:Apartment rdf:type rdfs:Class. 

swp:Apartment rdfs:subClassOf swp:ResidentialUnit. 
swp:Apartment rdfs:comments "The class of apartments". 
swp:House rdf:type rdfs:Class. 

swp:House rdfs:subClassOf swp:ResidentialUnit. 


swp:House rdfs:comment "The class of houses". 


swp:residesAt rdf:type rdfs:Property. 
swp:residesAt rdfs:comment "Relates persons to their residence". 
swp:residesAt rdfs:domain swp:Person. 


swp:residesAt rdfs:range swp:ResidentialUnit. 


swp:rents rdf:type rdfs:Property. 
swp:rents rdfs:comment "It inherits its domain (swp:Person) 
and range (swp:ResidentialUnit) from its superproperty (swp:residesAt)". 


swp:rents rdfs:subPropertyOf swp:residesAt. 


swp:address rdf:type rdfs:Property. 
swp:address rdfs:comment "Is a property of units and takes literals as its value". 
swp:address rdfs:domain swp:Unit. 


swp:address rdfs:range rdf:Literal. 


2.5.8 示例: 汽车 
这 里 ， 我 们 介绍 一 个 简单 的 汽车 本 体 。 图 2-7 展示 了 它 的 类 层次 。 


motorVehicle 







passenger Vehicle 


图 2-7 汽车 示例 的 类 层次 
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@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . 
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . 


<#miniVan> a rdfs:Class ; 


rdfs:subClassOf <#passengerVehicle>, <#van> . 
<#motorVehicle> a rdfs:Class . 


<#passengerVehicle> a rdfs:Class ; 
rdfs:subClassOf <#motorVehicle> . 


<#truck> a rdfs:Class ; 


rdfs:subClassOf <#motorVehicle> . 


<#van> a rdfs:Class ; 
rdfs:subClassOf <#motorVehicle> . 


2.6 RDF 和 RDF 模式 的 定义 


现在 我 们 已 经 了 解 了 RDF 和 RDFS 语言 的 主要 构成 ， 看 看 RDF Al RDFS 的 定义 可 能 很 
有 意义 。 这 些 定义 使 用 RDF 模式 语言 来 表达 。 一 个 任务 是 在 每 个 元 素 的 含义 都 已 经 清晰 的 基 
础 上 ， 观 察 它们 现在 如 何 能 够 被 简单 地 理解 。 

下 面 的 定义 仅仅 是 完整 语言 规范 的 一 部 分 。 剩 余部 分 可 以 在 rdf: RDF 命名 空间 里 看 到 。 
我 们 使 用 原始 的 XML 语法 来 给 出 它们 。 


2.6.1 RDF 


<?xml version="1.0" encoding="UTF-16"?> 

<rdf:RDF 
xmins:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" 
xmIns:rdfs="http://www.w3.org/2000/01/rdf-schema#” > 


<rdfs:Class rdf:ID="Staternent" 
rdfs:comment="The class of triples consisting of a 
predicate, a subject and an object 


(that is, a reified statement)" /> 


<rdfs:Class rdf:ID="Property" 


rdfs:comment="The class of properties" /> 
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<rdfs:Class rdf:ID="Bag" 


rdfs:comment="The class of unordered collections" /> 


<rdfs:Class rdf:ID="Seq" 


rdfs:comment="The class of ordered collections" /> 


<rdfs:Class rdf:ID="Alt" 

rdfs:comment="The class of collections of alternatives" /> 

<rdf:Property rdf:ID=" predicate" 

rdfs:comment="Identifies the property used in a statement 
when representing the statement 
in reified form” > 

<rdfs:domain rdf:resource="#Statement"/> 

<rdfs:range rdf:resource="#Property"/> 

</rdf:Property> 


<rdf:Property rdf:ID="subject" 

rdfs:comment="Identifies the resource that a statement is 
describing when representing the statement 
in reified form” > 

<rdfs:domain rdf:resource="#Statement"/> 


</rdf:Property> 


<rdf:Property rdf:ID="object" 
rdfs:comment="Identifies the object of a statement 
when representing the statement 


in reified form" /> 


<rdf:Property rdf:ID="type" 
rdfs:comment="Identifies the class of a resource. 
The resource is an instance 


of that class." /> 
</rdf:RDF> 


2.6.2 RDF 模式 


<rdf:RDF 


xmIns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" 
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xmins:rdfs="http://www.w3.org/2000/01/rdf-schema#” > 


<rdfs:Class rdf:ID="Resource" 


rdfs:comment="The most general class" /> 


<rdfs:Class rdf:ID="comment" 
rdfs:comment="Use this for descriptions” > 
<rdfs:domain rdf:resource="#Resource"/> 
<rdfs:range rdf:resource="#Literal" /> 
</rdfs:Class> 


<rdfs:Class rdf:ID="Class" 
rdfs:comment="The concept of classes. 

All classes are resources.” > 
<rdfs:subClassOf rdf:resource="#Resource"/> 


</rdfs:Class> 


<rdf:Property rdf:ID="subClassOf”> 
<rdfs:domain rdf:resource="#Class" /> 
<rdfs:range rdf:resource="#Class"/> 


</rdf:Property> 


<rdf:Property rdf:ID="subPropertyOf” > 
<rdfs:domain rdf:resource="&rdf;Property" /> 
<rdfs:range rdf:resource="&rdf;Property" /> 
</rdf:Property> 


</rdf:RDF> 


这 些 命名 空间 并 没有 提供 RDF 和 RDF 模式 的 完整 定义 。 例 如 考虑 rdfs:subClassOf. 
命名 空间 只 是 指定 它 被 用 于 类 ， 且 取 值 是 一 个 类 。 作 为 一 个 子 类 的 含义 ， 即 一 个 类 的 所 有 实 
例 也 是 它 的 超 类 的 实例 ， 没 有 在 任何 地 方 体现 。 事 实 上， 在 一 个 RDF 文档 中 这 是 无 法 表达 
的 。 如 果 可 以 表达 ， 就 没有 必要 定义 RDF 模式 了 。 

我 们 下 一 节 介 绍 一 个 形式 语义 。 显 然 ，RDF 解析 器 和 其 他 RDF 软件 工具 (包括 查询 处 理 
器 ) 必须 理解 完整 的 语义 。 


2.7 RDF 和 RDF 模式 的 公理 化 语义 


本 节 中 ， 我 们 形式 化 定义 RDF 和 RDF 模式 的 建 模 原 语 的 含义 。 因 而 ， 可 以 获得 RDF 和 
RDFS 的 语义 。 
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FRAT) A Rie a eia HF (predicate logic)， 它 作为 所 有 (符号 ) 知识 表示 的 基础 
被 广泛 接受 。 在 形式 化 过 程 中 使 用 的 公式 被 称 为 公理 (axiom). 

通过 使 用 形式 语言 (如 逻辑 形式 语言 ) 来 描述 RDF 和 RDFS 的 语义 ， 使 得 语义 没有 二 义 
性 并 且 机 器 可 存 取 。 另 外 ,我 们 通过 自动 推理 机 操纵 逻辑 公式 的 能 力 提供 了 对 推理 的 支持 。 


2.7.1 方法 

RDF 和 RDF 模 式 中 的 所 有 语言 原 语 被 表示 成 常量 : Resource, Class, Property, 
subClassOf, 等 等 。 一 些 预 先 定义 的 谓词 被 用 作 表 达 这 些 常量 之 间 联 系 的 基础 。 

使 用 链表 的 一 个 辅助 理论 ， 它 包括 下 面 的 函数 符号 

nil ( 空 链表 ) 

cons(x, l) (添加 一 个 元 素 到 链表 的 头 部 ) 

Jst( 人 (返回 第 一 个 元 素 ) 

rest( 四 (返回 链表 的 剩余 部 分 ) 
和 谓词 符号 

item(x, 由 ( 取 值 为 真 ， 当 且 仅 当 一 个 元 素 出 现在 链表 中 ) 

list) GUBAB, 4AM I ENER) 

链表 在 RDF 中 被 用 于 表达 容器 。 它 也 在 更 丰富 的 本 体 语言 中 用 于 表达 某 些 结 构 的 含义 
(例如 基数 约束 )。 

大 多 数 公 理 提供 了 类 型 信息 。 例 如 

Type(subClassO f, Property) 
表示 subClassOf 是 一 个 属性 。 我 们 使 用 带 等 式 的 谓词 逻辑 (predicate logic with equality), 7% 
量 名 以 ?开头 。 所 有 公理 都 隐 式 地 全 称 量化 。 

下 面 我 们 展示 RDF 和 RDF 模式 中 大 多 数 元 素 的 定义 。 完 整 语言 的 公理 化 语义 可 以 在 一 
个 在 线 文档 中 查看 ， 参 见 建议 阅读 中 的 文档 Fikes 和 McGuinness (2001)。 
2.7.2 基本 谓词 

基本 谓词 包括 : 

PropVal(P, R, V)， 一 个 包含 3 个 参数 的 谓词 ， 它 被 用 于 表达 一 个 包含 资源 尺 、 属 性 P 和 取 
{Hi V AY RDF 声明 。 

Type(R, T), J PropVal(Type, R, T) 的 缩写 ， 它 指出 一 个 资源 R 的 类 型 是 7。 


Type(?r, ?t) + PropVal(type, ?r, ?t) 
2.7-3 RDF 


1.28 
在 我 们 的 语言 中 ， 我 们 有 常量 Class, Resource, Property 和 Literal。 所 有 的 类 都 是 Class 
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的 实例 ， 即 它们 的 类 型 是 Class: 


Type(Class, Class) 

Type( Resource, Class) 

Type( Property, Class) 

Type( Literal, Class) 
Resource 是 最 一 般 的 类 : 每 个 对 象 都 是 一 个 资源 。 因 此 ， 每 个 类 和 每 个 属性 都 是 一 个 
资源 : 

Type(?p, Property) — Type(?p, Resource) 

Type(?c, Class) — Type(?¢, Resource) 
最 后 ， 一 个 RDF 声明 中 的 谓语 必须 是 一 个 属性 : 

PropVal(?p, ?r,?v) — Type(?p, Property) 

2. 类 型 属性 

type 是 一 个 属性 : 

Type(type, Property) 

注意 ， 它 和 PropVal(type, type, Property) 等 价 : type 的 类 型 是 Property。type 可 以 用 于 资源 ， 
并 且 取 值 是 一 个 类 : 

Type(?r, ?c) — (Type(?r, Resource) A Type(?c, Class)) 


3. 辅助 的 FuncProp 属性 

一 个 函数 型 属性 是 一 个 函数 : 它 将 一 个 资源 关联 到 最 多 一 个 值 。 也 数 型 属性 不 是 一 个 
RDF 的 概念 ， 但 是 它 用 于 其 他 原 语 的 公理 化 。 

常量 FuncProp 表示 所 有 函数 型 属性 的 类 。 已 是 一 个 函数 型 属性 ， 当 且 仅 当 它 是 一 个 属性 ， 
并 且 不 存在 x、y My, WE P(x, y), PŒ, y), Hy, # yo 


Type(?p, FuncProp) 人 
(Type(?p, Property) A Y?rY?v1Y?v2 
(PropVal(?p, ?7, ?v1) A PropVal(?p, ?7, ?v2) —>?v1 =?v2)) 


4. 具体 化 声明 
常量 Statement 表示 所 有 具体 化 声明 的 类 。 所 有 具体 化 声明 都 是 资源 ， 同 时 Statement 是 
Class 的 一 个 实例 : 
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Type(?s, Statement) — Type(?s, Resource) 

Type( Statement, Class) 

一 个 具体 化 声明 可 以 分 解 成 一 个 RDF 三 元 组 的 3 个 部 分 : 
Type(?st, Statement) —> 

3?p3?r3?v(PropVal( Predicate, ?st ?p)A 


PropVal(Subject, ?st ?r) A PropVal(Object, ?st, ?v)) 


Subject, Predicate 和 Object 是 函数 型 属性 。 也 就 是 说 ， 每 个 声明 只 能 有 一 个 主语 、 一 个 谓语 


和 一 个 宾语 : 
Type(Subject, FuncProp) 
Typel Predicate, FuncProp) 


Type(Object, FuncProp) 

它们 的 类 型 信息 是 
PropVal(Subject, ?st,?r) — 
(Type(?st, Statement) A Type(?r, Resource)) 
PropVal(Predicate, ?st, ?p) —> 
(Type(?st, Statement) A Type(?p, Property) ) 
PropVal(Object, ?st,?v) — 


(Type(?st, Statement) A (Type(?v, Resource) V Type(?v, Literal))) 


最 后 一 个 公理 的 含义 是 ， 如 果 Object 作为 属性 出 现在 一 个 RDF 声明 中 ， 那 么 它 必须 应 用 到 一 
个 具体 化 声明 上 上， 并且 取 值 是 一 个 资源 或 者 一 个 文字 。 
5. 容器 
所 有 的 容器 都 是 资源 : 
Type(?c, Container) — Type(?c, Resource) 
容器 是 链表 : 
Type(?c, Container) — list(?c) 
容器 可 以 是 包 、 序 列 或 者 选择 : 
Type(?c, Container) —> 


(Type(?c, Bag) V Type(?e, Seq) V Type(?c, Alt)) 
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包 和 序列 是 不 相交 的 : 
nm(Type(?z, Bag) A Type(?x, Seq)) 


对 于 每 个 自然 数 n>0， 存 在 一 个 选择 器 _n， 它 选择 一 个 容器 中 的 第 n 个 元 素 。 它 是 一 个 
函数 型 属性 


Type(_n, FuncProp) 
并 且 只 用 于 容器 : 
PropVal(_n, ?c,?0) — Type(?c, Container) 


27.4 ”RDF 模式 


1. 子 类 和 子 属 性 
subClassOf 是 一 个 属性 : 


Type(subClassO f, Property) 

如 果 一 个 类 C 是 另 一 个 类 CHT, 那么 C 的 所 有 实例 也 都 是 C 的 实例 : 
PropVal(subClassOj yc yc ) + 一 

(Type(?c, Class) A Type(?c', Class)A 

V?a(Type(?x, ?c) — Type(?z, ?c’))) 

对 于 subPropertyOf 也 类 似 。P 是 P' 的 一 个 子 属性 ， 仅 当 有 P(x, y) 时 必 有 P(x, y): 
Type(subPropertyO f, Property) 

PropV al(subPropertyO f,?p, ?p') <> 


(Type(?p, Property) ^A Type(?p', Property)A 
V?rV?u(PropV al(?p, ?7,?v) — PropVal(?p’, ?r, ?v))) 


2. AR 
每 个 约束 资源 是 一 个 资源 : 


PropVal(subClassO f, ConstraintResource, Resource) 
约束 属性 是 属性 ， 也 是 约束 资源 : 

Type(?cp, Constraint Property) 仁政 

(Type(?cp, Constraint Resource) A Type(?cp, Property)) 


domain 和 range 是 约束 属性 : 
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Type(domain, Constraint Property) 

Type(range, Constraint Property) 
domain fil range 分 别 定义 了 一 个 属性 的 定义 域 和 值 域 。 回 想 一 个 属性 P 的 定义 域 是 P 可 以 
应 用 在 的 一 个 对 象 集合 。 如 果 P 的 定义 域 是 D， 那 么 对 于 任意 Pk, y), 有 x ED。 

PropV al(domain, ?p, ?d) —> 

- VWavV?y(PropVal(?p, ?x, ?y) — Type(?x, ?d)) 

— PPE P IERE PAT WOR AEM. WMR PERE RR, MARTER P(x, y), 
有 y ER。 

PropVal(range, ?p, ?7) —> 

V?aV?y(PropV al(?p, ?7x,?Yy) — Type(?y, ?7)) 

从 上 述 公 式 可 以 推导 出 : 

PropV al(domain, range, Property) 

PropV al(range, range, Class) 

PropV al(domain, domain, Property) 

PropV al(range, domain, Class) 
因此 ， 我 们 已 经 形式 化 定义 了 RDF 和 RDFS 的 语义 。 装 配 这 种 知识 的 软件 能 够 产生 有 趣 的 
结论 。 例 如 ， 给 定 rents 的 值 域 是 ResidentialUnit, [iii ResidentialUnit Unit 的 一 个 子 类 ， 有 


rents(Jef{Meyer, BaronWayApartment), HKZ agent 可 以 使 用 谓词 逻辑 语义 或 任何 一 个 谓词 逻辑 
证 明 系 统 来 自动 地 演绎 出 Unit(BaronWayApartment), 


2.8 RDF 和 RDFS 的 一 个 直接 推理 系统 


如 前 所 述 ， 在 2.7 节 中 详细 介绍 的 公理 化 语义 可 以 用 作 RDF 和 RDF 模式 的 自动 化 推理 。 
但 是 ， 它 需要 一 阶 逻 辑 证 明 系 统 来 实现 。 这 是 一 个 很 重 的 需求 ， 并 且 当 涉及 数 以 百 万 计 ( 亿 
计 ) 的 声明 时 很 难 扩展 (例如 ， 数 以 百 万 计 的 Zpe(?r, ?c) 形式 的 声明 )。 

出 于 这 个 原因 ，RDF 也 被 赋予 了 一 个 基于 RDF 三 元 组 的 语义 (以 及 针对 这 种 语义 的 完备 
的 推导 系统 )， 取 代 基 于 一 阶 逻辑 来 重 述 RDF， 正 如 在 2.7 节 中 介绍 过 的 公理 化 语义 。 

推导 系统 包含 如 下 形式 的 规则 : 

IF 巨 包 含 某 些 三 元 组 

THEN 添加 一 些 额 外 的 三 元 组 到 EE 


(其 中 巨 是 任意 一 个 RDF 三 元 组 的 集合 )。 


这 里 不 再 重复 所 有 的 推导 规则 (这些 规 则 可 以 在 官方 的 RDF 文档 中 找到 )， 在 这 里 给 出 几 
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个 基本 的 例子 : 


IF 五 包含 三 元 组 (2x, 2p, ?7) 
THEN E 也 包含 三 元 组 (2p, rdf :type, rdf:Property) 


这 表明 任何 一 个 用 于 一 个 三 元 组 的 属性 位 置 的 资源 ?p 可 以 推导 出 它 是 rdf:Property 
一 个 或 许 更 加 有 趣 的 例子 是 下 面 的 规则 : 


IF EBAH (Qu, rdafs:subclassof, ?v) 和 (?v rdfs:subClassOf, ?w) 
THEN 五 也 包含 三 元 组 (?u, rdfs:subClassof, ?w) 


这 体现 了 子 类 关系 的 传递 性 。 
相关 的 规则 包括 : 


IF 包含 三 元 组 (?x, rdf:type, ?0 FI (?u, rdfs:subClassOf, ?v) 
THEN E 也 包含 三 元 组 (?x, rdf :type, ?v) 


这 定义 了 rdfs:subClassof 含义 的 本 质 。 
最 后 一 个 例子 常 令 第 一 次 了 解 RDF 模式 的 人 感到 惊讶 : 


IF 巨 包括 三 元 组 (Xx, 2p, W) 和 (p, rdfs:range, ?u) 
THEN E 也 包含 三 元 组 (?y, rdaf:type, ?u) 


这 个 例子 说 明 任何 一 个 资源 ?7 作为 一 个 属性 Op 的 值 出 现时 ， 它 可 以 被 推导 出 是 ?p 的 值 域 的 
一 个 成 员 。 这 说 明 RDF 模式 中 的 值 域 定义 不 是 用 来 约束 一 个 属性 的 值 域 ， 而 是 推导 值 域 的 成 
规则 闭 集 的 总 数 不 超过 几 十 个 ， 并 且 无 需 经 验 丰富 的 定理 证 明 技 术 来 高 效 实现 。 


2.9 小 结 


RDF 为 表示 和 处 理 机 器 可 理解 的 数据 提供 了 基础 。 

RDF 使 用 基于 图 的 数据 模型 。 它 的 核心 概念 包括 资源 、 属 性 、 声 明和 图 。 一 个 声明 是 
一 个 资源 - 属性 - 值 的 三 元 组 。 

RDF 拥有 三 种 标准 语法 (Turtle、RDF/XML 和 RDFa) 来 支持 语法 层 的 互 操作 性 。 
RDF 使 用 分 布 式 思 想 ， 人 允许 递增 式 的 构建 知识 ， 以 及 知识 的 共享 和 复 用 。 

RDF 是 领域 无 关 的 。RDF 模式 提供 了 一 种 描述 特定 领域 的 机 制 。 

RDF 模式 是 一 种 基本 的 本 体 语 言 。 它 提供 一 组 具有 固定 含义 的 建 模 原 语 。RDF 模式 的 
核心 概念 有 类 、 子 类 关系 、 属 性 、 子 属性 关系 ， 以 及 定义 域 和 值 域 限制 。 


建议 阅读 
下 面 列 出 了 一 些 官方 的 在 线 文档 : 
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e B. Adida and M. Birbeck. RDFa Primer: Bridging the Human and Data Webs.W3C Working 
Group Note. October 4, 2008. 
http://www.w3.org/TR/xhtml-rdfa-primer/. 

e D. Beckett, ed. RDF/XML Syntax Specification (Revised). W3C Recommendation.February 
10, 2004. 
http://www.w3.org/TR/rdf-syntax-grammar/. 

e D. Beckett, T. Berners-Lee, and E. Prud’hommeaux, eds. Turtle: Terse RDF Triple Language. 
W3C Working Draft. August 9, 2011. 
http://www.w3.org/TR/turtle/. 


D. Brickley and R.V. Guha, eds. RDF Vocabulary Description Language 1.0:RDF Schema. 

W3C Recommendation. February 10, 2004. 

http://www.w3.org/TR/rdf-schema/. 

e R. Fikes and D. McGuinness. An Axiomatic Semantics for RDF, RDF Schema and DAML+ 
OIL. March 2001. 
http://www.daml.org/2001/03/axiomatic-semantics.html. 

e P. Hayes, ed. RDF Semantics. W3C Recommendation. February 10, 2004. 
http://www.w3.org/TR/rdf-mt/. 

© G. Klyne and J. Carroll, eds. Resource Description Framework (RDF): Concepts and Abstract 
Syntax. W3C Recommendation. February 10, 2004. 
http://www.w3.org/TR/rdf-concepts/. 

èe F., Manola and E. Miller, eds. RDF Primer. W3C Recommendation. February 10, 2004. 
http://www.w3.org/TR/rdf-primer/. 

e E. Prud’hommeaux and A. Seaborne, eds. SPARQL Query Language for RDF. W3C Candidate 
Recommendation. June 14, 2007. 
http://www.w3.org/TR/rdf-sparql-query/. 

下 面 是 一 些 有 用 的 进 阶 阅读 : 

e C. Bizer and Richard Cyganiak. SPARQL The Trig Syntax. 

http://www4.wiwiss. fu-berlin.de/bizer/trig/. 


练习 和 项 目 


1. 列 出 10 个 标识 你 所 处 环境 中 的 事物 的 URI。 

2. 给 出 如 何 扩展 RDF 中 文字 定义 的 例子 。 为 什么 这 样 做 很 有 用 ? 

3. 阅读 RDFS 命名 空间 ， 尝 试 理解 本 章 中 没有 介绍 的 元 素 。 

4. RDFS 允许 为 一 个 属性 定义 超过 一 个 定义 域 ， 并 使 用 这 些 定义 域 的 交集 。 讨 论 采 用 定义 
域 的 并 集 和 交集 的 优 缺 点 。 

5. 在 早期 的 RDFS 规范 中 ，rqdfs:subclassof 不 允许 有 环 。 试 想 一 下 ， 什 么 情况 下 ， 
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一 个 类 联系 的 循环 是 有 益 的 (提示 : 考虑 类 的 等 价 关系 )。 

6. 讨论 下 面 声明 的 区 别 ， 并 用 图 的 形式 画 出 这 些 区 别 : 

X 支持 某 个 提案 ; Y 支持 这 个 提案 ; Z 支持 这 个 提案 。 

X、Y 和 ZZ 的 全 体 支 持 这 个 提案 。 

7. 使 用 前 面 的 公理 来 推导 2.7 节 末 的 公式 。 

8. 讨论 为 什么 RDF 和 RDFS 不 允许 逻辑 矛盾 。 任 何 RDF/S 文档 是 一 致 的 ， 因 此 它 拥 有 
至 少 一 个 模型 。 

9. 尝试 将 关系 数据 库 模 型 映射 到 RDF。 

10. 比较 实体 - 联系 模型 和 RDF。 

11. 用 RDF 模式 来 描述 图 书馆 的 一 部 分 : 图 书 、 作 者 、 出 版 商 、 年 代 、 册 数 、 日 期 ， 等 
等 。 接 下 来 用 RDF 写 出 一 些 声明 。 使 用 Turtle 语法 描述 并 使 用 一 个 检验 器 来 确保 你 的 RDF 
语法 上 有 效 。 参 见 http://librdf.org/parse 或 http://www.rdfabout.com/demo/validator/。 

12. 写 一 个 有 关 地 理 位 置 的 本 体 : 城市 、 国 家 、 首 都 、 边 界 、 州 ， 等 等 。 

13. 写 一 个 关于 你 自己 的 简单 网 页 。 标 识 网 页 中 的 概念 和 关系 ， 并 建立 一 个 小 的 本 体 来 表 
达 它 们 。 如 果 可 能 ， 使 用 一 个 已 经 存在 的 本 体 。 用 这 个 本 体 标注 你 的 网 页 。 

接 下 来 ， 你 要 考虑 RDFS 的 限制 。 具 体 地 ， 什 么 应 该 在 RDF 模式 中 被 真正 表达 ， 并 且 
是 否 能 够 被 表达 ? 这 些 限 制 将 与 第 4 章 相关 ， 在 第 4 章 中 我 们 将 介绍 一 种 更 加 丰富 的 建 模 
语言 。 

1) 考虑 男人 和 女人 类 。 命 名 一 个 应 该 被 包含 在 本 体 中 的 它们 之 间 的 联系 。 

2) 考虑 人 、 男 人 和 女人 这 3 个 类 。 命 名 一 个 应 该 被 包含 在 本 体 中 的 它们 三 者 之 间 的 联 
系 。 这 个 联系 的 哪些 部 分 可 以 在 RDF 模式 中 表达 ? 

3 ) 假设 我 们 宣称 Bob 和 Peter 都 是 Mary 的 父亲 。 显 然 这 里 存在 一 个 语义 错误 。 语 义 模 
型 应 该 如 何 做 才能 消除 这 个 错误 ? 

4)“is child of” 和 “is parent of” 之 间 的 联系 是 什么 ? 

5) 考虑 属性 eats， 它 的 定义 域 是 animal, [HÆ animal È plant。 假 设 我 们 定义 一 个 
新 类 vegetarian (素食 者 )。 为 这 个 类 在 属性 eats 上 命名 一 个 合适 的 约束 。 你 认为 通过 使 用 
rdfs:range 可 以 在 RDF 模式 中 表达 这 种 约束 吗 ? 
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在 上 一 章 中 ,我 们 学 会 了 如 何 使 用 RDF 来 表示 知识 。 当 信息 被 表示 为 RDF 后 ， 出 于 推 
ed die 我 们 需要 能 够 存 取 其 中 相关 的 部 分 。 在 本 章 中 ， 我 们 将 把 注意 力 集中 

一 个 叫做 SPARQL 的 查询 语言 ， 它 能 够 让 我 们 通过 选择 、 抽 取 等 方式 很 容易 地 从 被 表示 为 
RDF 的 知识 中 获得 特定 的 部 分 。SPARQL 是 专 为 RDF 设计 的 ， 适 合并 依赖 于 万 维 网 上 的 各 种 
技术 。 如 果 你 熟悉 诸如 SQL 等 数据 库 查询 语言 ， 你 会 发 现 SPARQL 和 它们 有 很 多 相似 之 处 。 
即便 你 不 熟悉 一 一 本 章 也 不 假设 你 已 熟悉 ， 本 章 将 为 你 从 头 开 始 学 习 提 供 一 切 所 需 。 


在 本 章 的 开头 ， 先 讨论 使 SPARQL 查询 得 以 执行 的 基础 设施 ( 即 软件 )。 接 下 来 ,讨论 
SPARQL 的 基础 知识 ， 并 逐步 介绍 其 更 复杂 的 部 分 。 最 后 ,我 们 集中 讨论 从 语义 网 上 收集 
RDF 数据 的 各 种 方式 。 


3.1 SPARQL 基础 设施 

想 要 执行 一 条 SPARQL 查询 ， 就 需要 一 个 能 执行 查询 的 软件 。 能 做 到 这 一 点 的 最 常用 的 
软件 叫做 三 元 组 存储 库 (triple store)。 本 质 上 ， 一 个 三 元 组 存储 库 就 是 一 个 RDF 的 数据 库 。 
在 网 上 可 以 下 载 到 很 多 三 元 组 存储 库 。 在 SPARQL 的 相关 规范 中 ， 三 元 组 存储 库 也 称 为 图 存 
储 库 。 

在 查询 一 个 三 元 组 存储 库 之 前 ， 需 要 先 向 其 中 填充 RDF 数据 。 大 部 分 三 元 组 存储 库 都 提 
供 批量 上 传 的 选项 。 也 有 一 种 称 为 SPARQL 更 新 的 机 制 ， 提 供 了 一 系列 向 三 元 组 存储 库 中 插 
入 、 加 载 及 删除 RDF 的 选项 。 本 章 中 将 稍 后 讨论 SPARL 更 新 。 

当 数 据 被 加 载 进 三 元 组 存储 库 之 后 ， 就 可 以 使 用 SPARQL 协议 来 发 送 SPARQL 查询 去 查 
询 了 。 每 个 三 元 组 存储 库 都 提供 一 个 端点 ( endpoint)， 在 此 提交 SPARQL 查询 。 重 要 的 一 点 
是 ， 客 户 端 使 用 HTTP 协议 向 端点 发 送 查 询 。 事 实 上 ， 要 将 一 条 SPARQL 查询 提交 给 一 个 端 
点 ， 其 实 可 以 将 它 输入 浏览 器 地 址 栏 中 ! 当然 ,我 们 还 是 建议 使 用 一 个 专门 为 SPARQL 设计 
的 客户 端 。 网 上 也 能 找到 很 多 。 

因为 SPARQL 使 用 标准 的 万 维 网 技术 ， 你 在 网 上 将 会 找到 大 量 的 SPARQL 端点 。 这 些 端 
点 可 以 让 你 存 取 大 量 的 数据 。 例 如 ，dbpedia.org/sparql 提供 了 一 个 查询 端点 来 查询 一 份 维基 
百科 的 RDF 表示 。 在 CKAN.org 中 可 以 找到 一 份 完整 的 SPARQL 端点 清单 。 

一 旦 我 们 有 了 这 个 基础 设施 ， 就 可 以 开始 写 SPARQL 查询 了 。 





3.2 ”基础 知识 ， 匹配 模式 
回顾 一 下 上 一 章 中 描述 Baron Way 公寓 及 其 位 置 的 RDF 数据 : 


@prefix swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl# >. 
@prefix dbpedia: <http://dbpedia.org/resource/>. 
@prefix dbpedia-owl: <http://dbpedia.org/ontology/>. 


swp:BaronWayApartment swp:hasNumberOfBedrooms 3; 
swp:isPartOf swp:BaronWayBuilding. 
swp:BaronWayBuilding dbpedia-owl:location dbpedia:Amsterdam, 
dbpedia:Netherlands. 


我 们 可 能 想 要 在 这 段 数据 上 做 一 个 查询 。 例 如 ， 找 到 这 幢 建 筑 的 位 置 。 怎 样 用 SPARQL 
来 表述 呢 ? 可 以 如 下 构建 这 个 查询 。 我 们 想 要 匹配 的 是 下 面 这 个 三 元 组 : 


swp:BaronWayBuilding dbpedia-owl:location dbpedia:Amsterdam. 


在 SPARQL 中 ,我 们 可 以 将 三 元 组 中 的 任何 一 个 元 素 蔡 换 为 一 个 变量 。 变 量 的 首 字 符 是 
一 个 ? (问号 )。 要 引入 一 个 变量 表示 位 置 ， 我 们 可 以 这 样 写 : 


.swp:BaronWayBuilding dbpedia-owl:location ?location. 


三 元 组 存储 库 将 接收 这 个 图 模式 (graph pattern) 9 并 尝试 去 找到 能 够 匹配 这 个 模式 
的 那些 三 元 组 集合 。 因 此 ， 在 之 前 的 RDF 数据 上 运行 这 个 模式 , 一 个 三 元 组 存储 库 将 会 
返回 dbpedia:Amsterdam 和 dbpedia:Netherlands。 本 质 上 ,， 它 找到 了 所 有 以 
swp:BaronWayBuilding 作为 主语 、dbpedia-owl:1ocation 作为 谓语 的 三 元 组 。 

要 构建 一 个 完整 的 SPARQL 查询 ， 还 需要 增加 一 些 内 容 。 首 先 ， 需要 定义 所 有 的 前 级 。 
还 需要 告诉 三 元 组 存储 库 我 们 对 一 个 特定 变量 的 结果 感 兴趣 。 因 此 ， 上 述 查 询 对 应 的 完整 


SPARQL 查询 如 下 : 


PREFIX swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 
PREFIX dbpedia: <http://dbpedia.org/resource/>. 

PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>. 

SELECT ?location 

WHERE { 


swp:BaronWayBuilding dbpedia-owl:location ?location. 


} 


与 Turtle 类 似 ，PREFIX 关键 词 指明 各 种 URL 的 缩写 。SELECT 关键 词 表 明了 哪些 变量 
是 感 兴趣 的 。 需 要 被 匹配 的 图 模式 出 现在 WHERE 关键 词 之 后 的 括号 中 。 返 回 的 查询 结果 是 


© A+, pattern 和 schema 都 被 翻译 为 “模式 ”， 通 常 可 根据 上 下 文 判 断 。 在 可 能 引发 误解 的 地 方 , “模式 ” 
默认 指 的 是 pattern。 当 指 的 是 schema 时 ， 会 在 括号 中 附加 英文 说 明 。 一 一 译 者 注 
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一 组 称 作 绑 定 (binding) 的 映射 ， 表 示 了 哪些 元 素 对 应 到 一 个 给 定 的 变量 。 表 格 中 的 每 一 行 
是 一 条 结果 或 一 个 绑 定 。 因 此 ， 这 条 查询 的 结果 如 下 : 


?location 





http://dbpedia.org/resource/Amsterdam. 





http://dbpedia.org/resource/Netherlands. 


SPARQL 的 全 部 基础 就 是 这 个 简单 的 概念 尝试 去 找到 能 够 匹配 一 个 给 定 图 模式 的 
那些 三 元 组 集合 。SPARQL 提供 了 更 多 的 功能 ， 用 来 指定 更 加 复杂 的 模式 并 以 不 同 的 方 
式 提供 结果 ; 但 是 无 论 模式 多 么 复杂 ， 运 用 的 过 程 都 是 一 样 的 。 再 举 一 个 例子 ， 查 找到 
BaronWayApartment 的 位 置 。 对 应 的 SPARQL 查询 是 : 





PREFIX swp: <http://www.semanticwebprimer.org/ontology/apartments.tt|#>. 
PREFIX dbpedia: <http://dbpedia.org/resource/>. 

PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>. 

SELECT ?location 


WHERE { 
swp:BaronWayApartment swp:isPartOf ?building. 


?building dbpedia-owl:location ?location. 

; : 

我 们 已 经 扩展 了 图 模式 。 在 这 个 查询 中 有 一 些 注意 点 : 首先 ， 变 量 也 作为 主语 出 现 。 在 
SPARQL 查询 中 ， 变 量 可 以 出 现在 任何 位 置 。 其 次 ,查询 重用 了 变量 名 ?building。 这 样 ， 三 
元 组 存储 库 就 知道 它 应 该 找 那 些 第 一 条 的 宾语 与 第 二 条 的 主语 相同 的 三 元 组 。 我 们 请 读者 来 
确定 这 条 查询 的 答案 。 

我 们 并 不 局 限于 只 匹配 一 个 变量 。 我 们 可 能 想 要 找到 三 元 组 存储 库 中 关于 Baron Way 
Apartment 的 所 有 信息 。 可 以 使 用 这 条 SPARQL 查询 : 

PREFIX swp: <http://www.semanticwebprimer.org/ontology/apartments.tt|#> 

PREFIX dbpedia: <http://dbpedia.org/resource/>. 





PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>. 
SELECT ?p ?0 
WHERE { 


swp:BaronWayApartment ?p ?o. 


} 
它 将 返回 如 下 结果 : 








swp:hasNumberOfBedrooms 3 





swp:isPartOf swp:Baron WayBuilding 
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同样 ， 表 格 中 的 每 一 行 是 一 条 单独 的 能 匹配 图 模式 的 结果 。 对 于 我 们 这 个 很 小 的 数据 集 ， 


所 有 可 能 的 答案 可 以 很 容易 地 返回 。 然 而 ， 在 更 大 的 数据 集 上 ， 我 们 可 能 不 知道 有 多 少 条 结 


果 ， 或 者 我 们 的 查询 会 不 会 返回 整个 数据 集 。 事 实 上 ， 写 一 些 能 返回 几 百 万 个 三 元 组 的 查询 
还 是 很 容易 的 。 因 此 ， 一 个 好 的 做 法 是 限制 一 条 查询 能 返回 的 答案 的 数量 ， 特 别 是 在 使 用 公 
共 端 点 时 。 这 很 容易 通过 使 用 如 图 3-1 所 示 的 LIMIT 关键 词 来 实现 。 在 这 个 图 中 ， 我 们 将 返 
回 的 结果 条 数 限制 为 10。 












PREFIX swp:  <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 
PREFIX dbpedia: <http://dbpedia.org/resource/>. 

PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>. 

SELECT ?p ?0 

WHERE { 

swp:BaronWayApartment ?p ?o. 





} 
LIMIT 10 


图 3-1 一 个 带 有 LIMIT 的 SPARQL 查询 


我 们 已 经 学 会 了 如 何 去 匹 配 单个 模式 或 者 由 多 个 三 元 组 模式 构成 的 链 。SPARQL 提供 了 


一 种 精确 表述 属性 链 的 方式 。 这 一 机 制 称 为 属性 路 径 (property path)。 例 如 下 面 这 个 例子 。 
找到 所 有 作为 一 幢 位 于 Amsterdam 的 建筑 的 一 部 分 的 那些 公寓 。 


PREFIX swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 
PREFIX dbpedia: <http://dbpedia.org/resource/>. 
PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>. 
SELECT ?apartment 
WHERE {` 
?apartment swp:isPartOf ?building. 
?building dbpedia-owl:location dbpedia:Amsterdam. 


} 
我 们 可 以 这 样 来 表达 同样 的 意思 : 


PREFIX ex: <http://www.example.org/> 
PREFIX dbpedia: <http://dbpedia.org/resource/> 
PREFIX geo: <http://www.geonames.org/ontology#>. 
SELECT ?tournament 
WHERE { 
?apartment swp:isPartOf/dbpedia-owl:location dbpedia:Amsterdam.. 


} 
有 许多 其 他 属性 路 径 可 以 用 来 帮助 在 查询 中 表述 很 长 的 、 各 式 各 样 的 路 径 。 在 本 章 中 ， 


强调 了 更 多 这 样 的 构造 子 。 事 实 上 ， 当 读者 写 更 复杂 的 SPARQL 查询 时 ， 这 些 属 性 路 径 的 快 
捷 表 示 可 能 会 变 得 更 有 用 。 
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我 们 仅仅 通过 匹配 图 模式 就 可 以 完成 很 多 事情 。 然 而 ， 有 时 候 我 们 想 要 对 查询 结果 施加 
更 复杂 的 约束 。 在 下 一 节 中 ， 我们 讨论 如 何 使 用 过 滤器 来 表述 这 些 约束 。 


3.3 ”过 滤器 


继续 看 公寓 这 个 例子 ， 让 我 们 来 找到 所 有 拥有 3 间 卧 室 的 公 室 。 目 前 我 们 已 经 看 到 的 例 
子 中 ， 在 查询 时 只 在 图 模式 中 使 用 过 资源 ， 还 没 使 用 过 文字 。 事 实 上 ， 文 字 可 以 直接 包含 在 
图 模式 中 。 这 样 的 SPARQL 查询 如 下 : 


PREFIX swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl# >. 
PREFIX dbpedia: <http://dbpedia.org/resource/>. 

PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>. 

SELECT ?apartment 

WHERE { 


?apartment swp:hasNumberOfBedrooms 3. 


} 


注意 ， 与 Turtle 类 似 ，SPARQL 也 允许 常见 文字 的 缩写 形式 。 在 这 个 例子 中 ,3 是 
"3"^^xsd:integer 的 缩写 表示 。SPARQL 和 Turtle 的 各 种 语法 缩写 表示 是 一 样 的 。 

然而 ， 这 个 查询 有 一 点 不 自然 。 绝 大 多 数 情况 下 ， 我 们 想 要 找 的 是 拥有 大 于 或 小 于 一 个 
特定 数量 的 卧室 的 那些 公寓 。 我 们 可 以 使 用 SPARQL 来 问 这 个 问题 ， 并 使 用 FILTER 关键 词 : 


PREFIX swp: = <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 
PREFIX dbpedia: <http://dbpedia.org/resource/>. 
PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>. 
SELECT ?apartment 
WHERE { 
?apartment swp:hasNumberOfBedrooms ?bedrooms. 


FILTER (?bedrooms > 2). 


apartment 
swp:BaronWay Apartment 


数值 型 数据 类 型 ( 即 整 型 数 、 小 数 ) 和 日 期 /时 间 都 支持 小 于 、 大 于 和 等 于 运算 。 
SPARQL 也 支持 字符 串 的 过 滤 。 例 如 ， 假 设 我 们 的 数据 集 包 含 如 下 三 元 组 : 








swp:BaronWayApartment swp:address "4 Baron Way Circle". 


我 们 可 能 想 要 找 所 有 在 地 址 中 包含 "4 Baron Way" 的 资源 。 这 可 以 使 用 SPARQL 内 置 支 
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持 的 正则 表达 式 来 实现 。 正 则 表达 式 是 一 种 表述 字符 串 搜 索 的 有 力 方式 。 详 细 介绍 正则 表达 
式 超出 了 本 书 的 范畴 ， 但 作者 鼓励 读者 去 探索 。 用 于 找到 字符 串 "4 Baron Way" 出 现在 另 一 个 
字符 串 开 头 的 正则 表达 式 是 "^4 Baron Way"。 这 可 以 如 下 表述 : 

PREFIX swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl# >. 

PREFIX dbpedia: <http://dbpedia.org/resource/>. 

PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>. 

SELECT ?apartment 

WHERE { 

?apartment swp:address ?address. 


FILTER regex(?address, "*4 Baron Way"). 
} 


这 里 ， 在 FILTER 关键 词 之 后 ， 引 入 了 一 个 特殊 的 过 滤 函 数 名 : regex。 这 个 函数 的 参数 
在 随后 的 括号 中 给 出 。SPARQL 还 包含 一 些 其 他 类 型 的 过 滤器 ， 在 一 些 特定 的 场合 中 可 能 有 
用 。 然 而 ， 数 值 和 字符 串 过 滤器 是 最 常 使 用 的 。 最 后 一 个 常用 的 函数 是 str。 它 将 资源 和 文字 
转换 为 可 以 在 正则 表达 式 中 使 用 的 字符 串 表 示 。 例 如 ， 我 们 可 以 在 资源 的 URL 而 不 是 标签 中 
搜索 Baron， 如 下 所 示 : 


PREFIX swp: <http://www.semanticwebprimer.org/ontology/apartments.tt|#>. 
PREFIX dbpedia: <http://dbpedia.org/resource/>. 
PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>. 
SELECT ?apartment ?address 
WHERE { 
?apartment swp:address ?address. 


FILTER regex(str(?apartment), "Baron"). 


} 


过 滤器 为 我 们 提供 了 一 种 获得 灵活 性 的 机 制 。SPARQL 提供 了 更 多 的 构造 子 来 处 理 语义 
网 上 发 现 的 往往 是 不 一 致 的 和 不 断 变 化 的 信息 。 


3.4 处理 一 个 开放 世界 的 构造 子 


与 传统 数据 库 不 同 ， 不 是 每 个 语义 网 上 的 资源 都 会 以 同样 的 模式 (schema) 描述 ， 或 者 都 
拥有 同样 的 属性 。 这 叫做 开放 世界 假设 。 例 如 ， 一 些 公寓 可 能 比 其 他 的 拥有 更 多 的 描述 。 进 
一 步 地 ， 它 们 可 能 以 一 种 不 同 的 词汇 表 来 描述 。 例 如 以 下 这 个 RDF 例子 : 

@prefix swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 

@prefix dbpedia: <http://dbpedia.org/resource/>. 

@prefix dbpedia-owl: <http://dbpedia.org/ontology/>. 

@prefix xsd: = <http://www.w3.org/2001/XMLSchema#>. 
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swp:BaronWayApartment swp:hasNumberOfBedrooms 3. 
swp:BaronWayApartment dbpedia-owl:location dbpedia:Amsterdam. 


swp:BaronWayApartment refs:label "Baron Way Apartment for Rent". 


swp:FloridaAveStudio swp:hasNumberOfBedrooms 1. 


swp:FloridaAveStudio dbpedia-owl:locationCity dbpedia: Amsterdam. 


在 这 个 例子 中 ，Florida Ave 单间 公寓 并 没有 一 个 对 人 类 友好 的 标签 ， 并 且 它 的 位 置 以 
dbpedia-owl:locationCity 而 非 dbpedia-owl: location 为 谓语 来 描述 。 即 便 有 这 
种 不 一 致 ， 我 们 仍然 想 要 在 数据 上 查询 并 找到 位 于 Amsterdam 的 公寓 并 返回 它们 对 人 类 友好 [78] 
的 标签 一 一 如 果 有 。SPARQL 为 表述 这 个 查询 提供 了 两 种 构造 子 。 让 我 们 来 看 一 个 样 例 查询 : 


PREFIX swp:  <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 
PREFIX geo: <http://www.geonames.org/ontology#>. 

PREFIX dbpedia: <http://dbpedia.org/resource/>. 

PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>. 


SELECT ?apartment ?label 

WHERE { 
{?apartment dbpedia-owl:location dbpedia: Amsterdam. } 
UNION 
{?apartment dbpedia-owl:locationCity dbpedia:Amsterdam.} 
OPTIONAL 


{?apartment rdfs:label ?label.} 


} 
这 个 查询 的 结果 是 : 





?apartment 





swp:BaronWayApartment Baron Way Apartment for Rent 


swp:FloridaAveStudio 





UNION 关键 词 告 诉 三 元 组 存储 库 返 回 那些 仅 匹 配 一 个 图 模式 或 两 个 都 匹配 的 结果 。 
OPTIONAL 关键 词 告诉 三 元 组 存储 库 为 特定 的 图 模式 返回 结果 一 一 如 果 能 找到 。 即 对 于 待 返 
回 的 查询 而 言 ， 这 个 图 模式 未 必要 被 满足 。 因 此 ， 在 这 个 例子 中 ， 如 果 没 有 这 个 可 选项 ， 这 
间 单 间 公寓 就 不 会 在 查询 结果 中 返回 。 : 
类 似 地 ， 属 性 路 径 也 可 被 用 来 创建 一 个 更 简洁 的 SPARQL 查询 。 使 用 | 运算 符 ， 我 们 可 
以 表述 一 个 或 更 多 的 可 能 性 。 因 此 ， 上 述 SPARQL 可 以 被 重 写 成 如 下 形式 : 
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PREFIX swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 
PREFIX dbpedia: <http://dbpedia.org/resource/>. 
PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>. 


SELECT ?apartment ?label 

WHERE { 
{?apartment dbpedia-owl:location|dbpedia-owl:locationCity dbpedia:Amsterdam. } 
OPTIONAL 
{?apartment rdfs:label ?label.} 


} 
这 些 仅仅 是 一 些 例子 ， 来 说 明 SPARQL 是 如 何 被 设计 为 可 以 容易 地 查询 来 自 不 同 来 源 的 知识 。 


35 ”组 织 结果 集 

一 种 常见 的 情况 是 ， 我 们 想 要 查询 结果 以 一 种 特定 的 方式 返回 : 分 组 的 、 计 数 的 或 排序 
的 。SPARQL 支持 一 些 函 数 来 帮助 我 们 组 织 结 果 集 。 我 们 已 经 知道 了 如 何 使 用 LIMIT 关键 
词 来 限制 结果 的 数量 。 我 们 也 可 以 使 用 DISTINCT 关键 词 ， 把 它 放 在 选择 关键 词 之 后 (例如 
SELECT DISTINCT ?name WHERE)， 来 消除 结果 集中 的 重复 结果 。 这 将 确保 返回 互 不 相同 的 
变量 绑 定 。 

SPARQL 也 人 允许 使 用 ORDER BY 关键 词 来 对 返回 的 结果 集 排 序 。 例 如 ， 我 们 可 以 要 求 公 
寅 按 卧 室 数量 排序 。 

PREFIX swp: “<http://www.semanticwebprimer.org/ontology/apartments.ttl##>. 


PREFIX dbpedia: <http://dbpedia.org/resource/>. 
PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>. 


SELECT ?apartment ?bedrooms 
WHERE { 
?apartment swp:hasNumberOfBedrooms ?bedrooms. 


} 
ORDER BY DESC(?bedrooms) 


其 返回 的 是 : 


?apartment ?bedrooms 





swp:BaronWayApartment 3 





swp:FloridaAveStudio 1 
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DESC 关键 词 指明 了 按 降序 排列 。 类 似 地 ，ASC 指 的 是 升序 。 此 外 ， 注 意 字 符 串 或 URL 
的 排序 是 根据 字典 序 。 

我 们 也 可 以 使 用 聚集 (aggregate) 函数 来 汇总 结果 集 。 特 别 地 ， 我 们 可 以 计数 结果 的 数量 
(COUNT)、 求 和 (SUM) 以 及 计算 最 小 值 、 最 大 值 和 平均 值 (MIN. MAX、AVG)。 这 是 一 个 
计算 我 们 的 数据 集中 平均 卧室 数量 的 例子 。 


PREFIX swp: <http: //www.semanticwebprimer.org/ontology/apartments.ttl#>. 
PREFIX dbpedia: <http://dbpedia.org/resource/>. 
PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>. 


SELECT (AVG(?bedrooms) AS ?avgNumRooms) 
WHERE { 
?apartment swp:hasNumberOfBedrooms ?bedrooms. 


} 
它 将 返回 : 


2 


这 个 聚集 函数 与 AS 关键 词组 合 使 用 ， 来 指明 结果 集中 的 变量 。 并 没有 限制 我 们 在 整个 
结果 集 上 运用 这 些 聚 集 。 我 们 也 可 以 使 用 GROUP BY 关键 词 来 聚集 特定 的 分 组 。 
Ak, SPARQL 为 以 最 适合 具体 应 用 的 方式 组 织 结果 提供 了 有 力 机 制 。 


3.6 ”其 他 形式 的 SPARQL 查询 


到 目前 为 止 ， 我 们 已 经 关注 了 从 一 个 RDF 集合 中 选择 特定 的 值 。SPARQL 也 支持 一 些 其 
他 形式 的 查询 。 除 了 SELECT 以 外 ， 两 种 常用 的 查询 是 ASK 和 CONSTRUCT。 

ASK 形式 的 查询 简单 地 检查 一 个 数据 集中 是 否 存在 一 个 图 模式 ， 而 不 是 去 返回 结果 。 例 
如 ， 下 面 这 个 查询 将 返回 真 。 

PREFIX swp: = <http://www.semanticwebprimer.org/ontology/apartments.ttl# >. 

PREFIX dbpedia: <http://dbpedia.org/resource/>. 

PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>. 

ASK ?apartment 

WHERE { 

apartment swp:hasNumberOfBedrooms 3. 


} 


使 用 ASK 查询 的 原因 是 ， 比 起 检索 一 个 完整 的 结果 集 ，ASK 查询 计算 得 更 快 。 
CONSTRUCT 形式 的 查询 用 来 从 一 个 更 大 的 RDF 集中 检索 出 一 个 RDF 图 。 因 此 ， 可 以 
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查询 一 个 三 元 组 存储 库 并 检索 一 个 RDF 图 而 非 一 组 变量 绑 定 。 例 如 ， 我 们 可 以 创建 一 个 新 
图 ， 将 那些 拥有 超过 2 间 卧 室 的 公寓 标记 为 大 公寓 。 


PREFIX ex: <http://www.example.org/ > 
PREFIX dbpedia: <http://dbpedia.org/resource/> 
PREFIX geo: <http://www.geonames.org/ontology#> 
CONSTRUCT {?apartment swp:hasNumberOfBedrooms ?bedrooms. ?apartment swp:isBigApartment true. } 
WHERE{ 
?apartment swp:hasNumberOfBedrooms ?bedrooms. 


} 
FILTER (?bedrooms > 2) 


这 将 返回 如 下 的 图 。 
@prefix swp:  <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 
@prefix dbpedia: <http://dbpedia.org/resource/>. 


@prefix dbpedia-owl: <http://dbpedia.org/ontology/>. 
@prefix xsd: <http://www.w3.org/2001/XMLSchema#>. 


swp:BaronWayApartment swp:hasNumberOfBedrooms 3. 


swp:BaronWayApartment swp:isBigApartment true. 


CONSTRUCT 查询 经 常用 来 在 模式 (schema) 之 间 转 换 一 一 通过 查询 特定 的 模式 ， 并 用 
目标 模式 中 的 属性 替换 。 


3.7 ”查询 模式 


重要 的 是 ， 因 为 模式 (schema) 信息 是 用 RDF 表示 的 ，SPARQL 可 以 用 来 查询 关于 模式 
本 身 的 信息 。 例 如 ， 以 下 是 上 一 章 中 住房 本 体 的 一 部 分 。 


@prefix swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#->. 
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>. 


swp:Unit rdf:type rdfs:Class. 


swp:ResidentialUnit rdf:type rdfs:Class. 


swp:ResidentialUnit rdfs:subClassOf swp: Unit. 


swp:Apartment rdf:type rdfs:Class. 


swp:Apartment rdfs:subClassOf swp:ResidentialUnit. 
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使 用 SPARQL， 通 过 同时 查询 实例 数据 和 模式 (schema), 我们 可 以 确定 数据 集中 的 
Residential Units: 


PREFIX swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 


PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> . 


SELECT athlete 
WHERE{ 
?apartment a ?unitType. 
?unit Type rdfs:subClassOf swp:ResidentialUnit. 


} 


注意 ,我 们 使 用 了 与 Turtle 相同 的 缩写 法 : 用 a 来 表示 rdf :type。 对 模式 的 查询 能 力 
是 SPARQL 和 RDF 的 一 项 重要 能 力 ， 因 为 它 不 仅 允 许 检索 信息 ， 还 可 以 查询 信息 的 语义 。 


3.8 通过 SPARQL 更 新 来 增加 信息 

正如 3.1 节 所 述 ，SPARQL 也 定义 了 一 个 用 来 更 新 三 元 组 存储 库 内 容 的 协议 。 这 就 是 
SPARQL 更 新 协议 。 本 质 上 ， 它 在 SPARQL 中 引入 了 一 系列 新 的 关键 词 来 支持 三 元 组 的 插 
入 、 加 载 和 删除 。 以 下 我 们 展现 每 种 请 求 的 例子 。 

揪 入 和 加 载 三 元 组 以 下 搬入 一 个 三 元 组 ， 痢 述 Luxury Apartment 是 Apartment 的 一 个 
子 类 。 它 将 这 个 三 元 组 加 入 三 元 组 存储 库 的 已 有 内 容 之 中 。 

PREFIX swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> . 


INSERT DATA 
{ 


swp:LuxuryApartment rdfs:subClassOf swp:Apartment. 
} 
注意 ， 数 据 本 身 仍 是 我 们 在 第 2 章 中 就 熟悉 的 Turtle 语法 。 


如 果 你 在 万 维 网 上 有 一 个 大 的 包含 RDF 的 文件 ， 你 可 以 使 用 以 下 命令 将 它 加 载 进 一 个 三 
元 组 存储 库 : 


LOAD <http://example.com/apartment.rdf> 


删除 三 元 组 ”从 一 个 三 元 组 存储 库 中 删除 三 元 组 有 几 种 方式 。 一 种 是 使 用 DELETE 
DATA 关键 词 准 确 指定 哪些 三 元 组 是 你 想 要 删除 的 。 将 之 前 插入 的 三 元 组 删除 可 以 这 样 : 

PREFIX swp: <http://www.semanticwebprimer.org/ontology/apartments.tt|#>. 

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> . 
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DELETE DATA 
{ 


swp:LuxuryApartment rdfs:subClassOf swp:Apartment. 


} 


注意 ， 在 这 种 形式 下 是 不 允许 变量 的 ， 所 有 三 元 组 都 必须 被 完整 指定 。 
一 种 更 加 灵活 的 方式 是 使 用 DELETE WHERE 构造 子 。 它 可 以 删除 匹配 指定 图 模式 的 那 


些 三 元 组 。 以 下 将 要 删除 包含 关于 拥有 超过 2 间 卧 室 的 公寓 的 信息 的 所 有 三 元 组 。 


PREFIX swp: <http://www.semanticwebprimer.org/ontology/apartments.ttl#>. 
PREFIX rdfs: 9 <http://www.w3.org/2000/01/rdf-schema#> . 


WHERE{ 
?apartment swp:hasNumberOfBedrooms ?bedrooms. 


FILTER (?bedrooms > 2) 
} 


在 这 两 种 形式 中 ， 如 果 模 式 未 能 匹配 或 者 三 元 组 不 在 三 元 组 存储 库 中 ,那么 什么 都 不 会 
发 生 。 
最 后 ， 要 删除 一 个 三 元 组 存储 库 中 的 所 有 内 容 ， 可 以 如 下 使 用 CLEAR 构造 子 : 


CLEAR ALL 


SPARQL 更 新 提供 了 更 多 的 构造 子 来 管理 部 分 三 元 组 存储 库 。 如 果 向 一 个 三 元 组 存储 库 
中 逐步 添加 数据 ， 那 么 更 新 操作 就 特别 有 用 了 。 在 下 一 节 中 ,我 们 讨论 一 种 特殊 情况 ， 其 中 
这 些 更 新 操作 很 有 用 。 


3.9 “跟着 感觉 走 ” 原 则 


SPARQL 提供 了 机 制 来 查询 和 更 新 三 元 组 存储 库 。 但 是 ， 如 何 填充 这 些 三 元 组 存储 库 
We? 如 前 所 述 ， 许 多 数据 提供 者 通过 SPARQL 端点 发 布 他 们 的 数据 。 然 而 ， 其 他 数据 提供 者 
仅仅 通过 链接 数据 的 形式 。 即 RDF 数据 或 者 以 万 维 网 文件 的 形式 发 布 ， RA A He TE I TP 
我 们 可 以 将 这 些 三 元 组 插入 本 地 的 三 元 组 存储 库 中 。 然 而 ,语义 网 允许 任何 提供 者 使 用 万 维 
网 上 的 其 他 资源 和 信息 来 描述 他 们 的 信息 。 在 这 些 情况 下 ， 可 以 运用 跟着 感觉 走 原则 (follow 
your nose principle): 给 定 一 个 指向 某 些 RDF 的 URL， 通 过 解 引 用 这 个 URL 来 加 载 相应 的 数 
据 。 可 以 持续 这 样 做 ， 直 到 有 足够 的 三 元 组 来 回答 给 定 的 查询 。 

一 些 查询 引擎 ， 如 SQUIN， 实 现 了 这 一 功能 (参见 http://squin.sourceforge.net/)。 此 外 ， 
新 版 本 的 SPARQL 也 包含 了 这 些 联邦 查询 命令 。 然 而 ， 这 种 联邦 查询 往往 很 耗 时 ， 因 为 数据 
必须 在 查询 时 才能 收集 。 

跟着 感觉 走 是 一 种 在 使 用 语义 网 来 处 理 查询 时 收集 所 需 信 息 的 方式 。 
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3.10 “小 结 


在 本 章 中 ,我们 介绍 了 SPARQL 查询 和 更 新 ， 以 及 支撑 SPARQL 的 基础 设施 。 

。 SPARQL 通过 匹配 图 模式 来 选择 信息 ， 并 提供 基于 数值 和 字符 串 比 较 的 过 滤 机 制 。 

© SPARQL 查询 采用 类 似 Turtle 的 语法 。 

。 数据 和 模式 (schema) 都 可 以 使 用 SPARQL 来 查询 。 

。 UNION 和 OPTIONAL 构造 子 允 许 SPARQL 更 容易 地 处 理 开 放 世 界 数据 。 

。 SPARQL 更 新 提供 了 从 三 元 组 存储 库 中 更 新 和 删除 信息 的 机 制 。 

建议 阅读 

e ARQ SPARQL Tutorial. http://jena.sourceforge.net/ARQ/Tutorial/. 

e S. Harris and A. Seaborne, eds. SPARQL 1.1 Query Language. W3C Working Draft (work in 
progress), 12 May 2011. 
http://www.w3.org/TR/sparql11-query/. 

e A. Polleres, P. Gearon, and A. Passant, eds. SPARQL 1.1 Update. W3C Working Draft (work 
in progress), 12 May 2011. www.w3.org/TR/sparq|11-update/. 


e E. Torres, L. Feigenbaum, and K. Clark, eds. SPARQL Protocol for RDF. W3C 
Recommendation, 15 January 2008. www.w3.org/TR/rdf-sparq|l-protocol/. 


练习 和 项 目 

1 从 本 章 给 出 的 查询 中 选择 一 个 。 将 其 背后 的 数据 画 成 一 张 图 。 再 画 一 个 图 ,标记 选择 
的 查询 中 的 那些 变量 。 你 能 将 查询 也 表述 为 一 个 图 吗 ? 

2. 思考 什么 会 让 一 条 SPARQL 查询 难以 被 一 个 三 元 组 存储 库 回答 。 讨 论 哪 些 因 素 对 回答 
查询 造成 了 困难 。 

3. 比较 SPARQL 和 SQL. 语言 上 的 不 同和 相似 之 处 分 别 是 什么 ? 

4. 在 http://www.dbpedia.org 上 执行 几 条 查询 ， 使 用 其 提供 的 执行 查询 的 几 个 万 维 网 界面 中 
的 一 个 : http://dbpedia.org/snorql 或 者 http:/dbpedia.org/sparql。 讨 论 构建 查询 的 困难 是 什么 。 

5. 下 载 并 安装 一 个 三 元 组 存储 库 。 例 如 4store、Virtuoso 、Sesame 和 OWLIM。 加 载 本 书 
网 站 (http:Wwww.semanticwebprimerorg) 上 的 RDF 数据 ， 看 看 你 能 否 回答 本 章 中 的 所 有 查 
询 。 如 果 三 元 组 存储 库 支 持 推理 ， 查 询 答案 会 随 着 结果 变化 吗 ? 

6. 讨论 SPARQL 如 何 使 用 其 他 万 维 网 标准 (例如 HTTP)。 

7. 在 构建 SPARQL 查询 时 ， 本 体 的 好 处 是 什么 ? 

8. 作为 一 项 更 大 的 任务 , 每 2 ~ 4 人 为 一 组 ， 开 发 一 个 万 维 网 应 用 。 使 用 上 一 章 中 的 一 
个 本 体 作 为 基础 。 例 如 ， 可 以 开发 一 个 公寓 或 者 图 书 的 查找 应 用 。 不 采用 标准 的 数据 库 作 
为 数据 存储 方式 ， 而 是 采用 三 元 组 存储 库 。 我 们 建议 使 用 rdfquery javascript E ( http://code. 
google.com/p/rdfquery/) 在 网 页 中 与 三 元 组 存储 库 交 互 。 此 外 ,一 个 PHP ( 超 文本 预 处 理 咒 ) 
引擎 ， 诸 如 RAP ( http:/www4.wiwiss.fu-berlin.de/bizer/rdfapi/)， 是 男 一 个 选择 。 应 用 构建 完 
成 以 后 ， 写 一 个 报告 阐述 使 用 本 体 和 三 元 组 存储 库 来 开发 万 维 网 应 用 的 优点 和 缺点 。 
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万 维 网 本 体 语 言 : OWL2 


4.1 引言 


使 用 前 几 章 中 介绍 的 RDF 和 RDF 模式 来 描述 各 种 事物 是 非常 受 限 的 。RDF (笼统 地 说 ) 
被 限定 为 二 元 闭 谓词 ， 而 RDF 模式 (笼统 地 说 ) 被 限定 为 子 类 层次 和 属性 层次 ， 以 及 属性 的 
定义 域 和 值 域 定义 。 这 两 种 语言 的 设计 都 考虑 灵活 性 。 

但 是 ， 在 许多 情况 下 ,我们 需要 表达 更 加 先进 的 、 更 具 “ 表 达能 力 的 ”的 知识 一 一 例如 ， 
每 个 人 只 有 一 个 精确 的 出 生日 期 , 或 者 没有 人 可 以 同时 是 男人 和 女人 。 | 

后 续 的 W3C 工作 组 9S、 万 维 网 本 体 工作 组 和 OWL 工作 组 ,标识 了 语义 网 中 的 一 些 典 型 
用 例 ， 它 们 需要 RDF 和 RDFS 已 经 提供 的 语言 特征 以 外 的 更 多 特征 。 结 果 产 生 了 OWL2 if 
言 ， 代 表 万 维 网 本 体 语言 ， 它 和 逻辑 家 族 中 的 一 类 关联 紧密 ， 该 类 特别 适合 表达 术语 知识 。 
描述 逻辑 (Description Logic, DL) 有 很 长 的 历史 ， 并 且 它 的 特性 被 大 家 广泛 理解 。OWL2 是 
OWL 语言 的 第 2 版 。 


在 本 章 中 ， 首 先 根据 需求 描述 OWL2 的 动机 (4.2 17) 以 及 它 与 RDF 和 RDFS 的 关系 
(4.3 节 )。 接 下 来 ,我们 在 4.4 节 中 详细 介绍 OWL 的 各 种 语言 元 素 ， 之 后 在 4.5 节 讨 论 3 个 
OWL2 概要 (profile), 


4.2 ”本 体 语言 的 需求 

我 们 已 经 在 前 面 的 章节 中 看 到 了 RDF 和 RDFS 允许 我 们 描述 存在 于 某 个 领域 中 的 类 ,或 
者 “概念 "， 并 允许 我 们 在 万 维 网 上 共享 这 些 描 述 。 一 个 领域 中 概念 的 显 式 的 形式 化 规约 称 为 
本 体 ( ontology)。 因 此 允许 我 们 表达 本 体 的 语言 称 为 本 体 语言 (ontology language)。 对 这 些 
语言 的 主要 需求 包括 : 一 个 良 定 的 语法 ， 一 个 形式 语义 ， 足 够 的 表达 能 力 ， 方 便 的 表达 方式 
和 高 效 的 推理 支持 。 


4.2.1 语法 
一 个 良 定语 法 (well-defined syntax) 的 重要 性 在 于 清晰 并 且 被 编程 语言 领域 熟知 ， 这 是 机 
器 处 理 信息 的 必要 条 件 。 一 个 语法 是 良 定 的 ， 仅 当 你 能 够 使 用 它 以 一 种 无 二 义 的 方式 写 出 某 


日 参见 http://www.w3.org/2001/sw/WebOnt/ 和 http://www.w3.org/2007/OWL/wiki/OWL_Working_Group. 





种 语言 允许 你 表达 的 所 有 事物 。 我 们 已 经 介绍 过 的 所 有 语言 都 有 一 个 良 定 的 语法 。 正 如 我 们 
将 看 到 的 ，OWL2 建立 在 RDF 和 RDFS ZL, 并且 使 用 了 它们 语法 的 一 种 扩展 。 

一 个 良 定 的 语法 不 必 是 非常 友好 的 。 例 如 ， 众 所 周知 RDF/XML 语法 对 人 而 言 难以 阅读 。 
但 是 这 个 缺点 并 不 是 非常 关键 ， 因 为 绝 大 多 数 本 体 工程 师 会 使 用 专门 的 本 体 开 发 工具 ， 而 不 
是 文本 编辑 器 ， 来 构建 本 体 。 


4.2.2 ”形式 语义 

形式 语义 (formal semantic) 精确 地 描述 了 一 种 语言 的 含义 。 精 确 (precisely) 意味 着 语义 
不 涉及 主观 想象 ， 不 同人 或 机 器 ) 也 不 会 存在 不 同 的 解释 。 例 如 ， 形 式 语义 的 重要 性 在 数理 
人 逻辑 领域 中 被 很 好 地 建立 起 来 。 

将 形式 语义 和 一 个 良 定 的 语法 组 合 起 来 允许 我 们 解释 (interpret) 用 某 种 语法 表达 的 句子 : 
我 们 现在 理解 (know) 了 句子 的 含义 。 形 式 语义 也 使 得 我 们 对 表达 在 句子 中 的 知识 进行 推理 。 
例如 ，RDFS 的 形式 语义 允许 我 们 推理 类 成 员 关 系 (class membership)。 给 定 : 

xrdftype C. 

:C rdfs:subClassOf :D . 

我 们 可 以 推导 出 :x 是 :D 的 一 个 实例 。rdfs:domain 和 rdfs:range 属性 允许 类 似 
的 推理 : 

:p rdfsrange  :D. 

xip y. 


人 允许 我 们 推导 出 :y rdf:type :D。 


4.2.3 ”表达 能 力 

FEWE, RDF 和 RDFS 的 表达 能 力 (expressive power) 在 某 些 地 方 非常 有 限 。 我 们 有 
时 需要 提供 超出 RDF 和 RDFS 允许 描述 的 更 精确 的 定义 。 如 果 构 建 本 体 ， 可 能 希望 能 够 进行 
如 下 推理 : 

类 成 员 关系 ”我 们 已 经 看 到 RDFS 拥有 一 些 简单 的 机 制 ， 使 用 子 类 和 定义 域 / 值 域 来 检 
测 个 体 实例 的 类 成 员 关 系 。 但 是 ， 对 于 一 个 实例 在 什么 情况 下 可 以 被 认为 属于 一 个 类 的 更 精 
确 的 描述 将 允许 更 加 精细 的 推理 。 例 如 ， 如 果 我 们 已 经 声明 某 些 属性 - 值 对 是 一 个 类 :A 的 成 
员 关系 的 充分 条 件 ， 则 如 果 某 个 实例 :x 满足 这 些 条 件 ， 我 们 可 以 得 出 :x 必然 是 :A 的 实例 
的 结论 : 某 个 事物 是 网 球 比赛 ,那么 它 至 少 包含 球员 、 球 拍 等 。 

分 类 ”类似 地 ， 我 们 希望 使 用 类 成 员 关 系 的 条 件 来 推导 类 自身 之 间 的 关系 。 例 如 ， 一 个 
网 球 比 赛 的 简单 定义 可 以 重用 来 定义 羽毛 球 比赛 。 

等 价 关 系 和 相同 性 ”表达 类 之 间 的 等 价 关系 (equivalence) 很 有 用 。 例 如 ，:Tortoise 
类 和 :Land Turtle 类 共享 所 有 的 成 员 ; 因此 它们 是 等 价 的 。 类 似 地 ， 我 们 希望 能 够 表达 两 
个 实例 何 时 相同 : :morning_star 和 :evening_star 是 同 个 星球 :venus 的 不 同名 字 ， 
因此 这 些 实例 是 相同 的 。 能 够 直接 表达 这 些 很 好 ， 但 是 也 应 该 可 以 通过 在 类 的 描述 上 应 用 形 
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式 语 义 来 确定 等 价 关 系 和 相同 性 。 
不 相交 关系 和 不 同性 同样 ， 有 时 我 们 知道 两 个 类 不 共享 任何 实例 (它们 是 不 相交 

的 〈disjoint)) 或 者 两 个 实例 是 明确 不 同 的 事物 。 例 如 ，:Winner 和 :Loser 是 不 相交 的 ， 
而 :roger_federer 和 :rafael nadal 是 不 同 的 个 体 。 

类 的 二 元 组 合 有 时 类 需要 以 超出 子 类 关系 的 方式 组 合 。 例 如 ， 我们 可 能 希望 定 
X : Person 类 是 两 个 不 相交 类 :Female 和 :Male 的 并 集 。 

属性 的 局 部 作用 域 rdfs:range 声明 一 个 属性 的 值 域 中 的 实例 ， 例 如 :Plays 的 值 域 
都 属于 某 个 类 。 因 此 ， 在 RDFS 中 我 们 不 能 区 别 不 同情 境 中 的 值 域 限制 。 例 如 ， 我 们 不 能 说 
网 球 运 动员 只 打 网 球 ， 而 其 他 人 可 能 打 羽 毛 球 。 

属性 的 特性 ”有 了 时 声明 一 个 属性 是 传递 的 ( transitive), 例 如 :greater than; 唯一 的 
(unique)， 例 如 :is mother of; 或 者 互 北 的 (inverse), PM :eats 和 :is eaten by, 
都 很 有 用 。 

基数 限制 “有 时 ， 我 们 需要 对 一 个 属性 可 能 或 者 必须 拥有 的 不 同 取 值 的 数目 施加 限制 。 
例如 ， 每 个 人 有 且 只 有 双亲 ， 一 门 课 至 少 需要 一 个 讲师 授课 。 

一 致 性 一 旦 我 们 能 够 确定 类 之 间 的 关系 ,我 们 可 能 也 希望 确定 它们 定义 之 间 的 冲突 。 
假设 我 们 声明 : Fish 和 :Mammal 是 不 相交 的 类 ， 则 断言 :dolphin 是 两 者 共同 的 实例 则 是 
个 错误 。 一 个 具有 足够 表达 能 力 的 本 体 语言 应 该 允许 我 们 检测 这 些 不 一 致 性 的 情况 。 

最 后 ,一 个 本 体 语言 必须 使 得 利用 它 的 表达 能 力 来 构建 句子 越 方便 (convenient) 越 好 。 

例如 ， 一 个 语言 如 果 在 我 们 希望 声明 两 个 类 等 价 时 需要 不 断 重复 完整 的 定义 ， 那么 它 可 能 就 

不 是 很 方便 。 


4.2.4 ”推理 支持 

形式 语义 是 推理 支持 ( reasoning support) 的 前 提 。 推 导 之 前 的 例子 可 以 通过 机 制 而 非 手 
工 完成 。 自 动 推 理 很 重要 ， 因 为 它 允许 我 们 检查 本 体 的 正确 性 。 例 如 : 

。 检查 本 体 的 一 致 性 。 

。 检查 类 之 间 的 意外 关系 。 

。 检查 实例 的 意外 分 类 。 

自动 的 推理 支持 允许 检查 比 手工 检查 更 多 的 情况 。 诸 如 对 前 述 例子 的 检查 对 于 设计 大 型 
本 体 非常 有 价值 ， 例 如 当 涉 及 多 个 作者 时 ， 又 如 当 从 不 同 数据 源 集成 和 共享 本 体 时 。 

我 们 能 够 通过 将 一 个 本 体 语 言 映 射 到 一 个 已 知 的 逻辑 系统 ， 并 且 通 过 使 用 针对 该 系统 已 
有 的 自动 化 推理 机 ， 为 该 本 体 语言 提供 形式 语义 和 推理 支持 。 

很 明显 ， 我 们 需要 比 RDF 模式 更 加 丰富 的 本 体 语言 ， 一 种 能 够 提供 上 述 特征 甚至 更 多 特 
征 的 语言 。 在 设计 这 种 语言 的 过 程 中 ， 应 该 意识 到 表达 能 力 和 高 效 推理 支持 之 间 的 权衡 。 通 
俗 地 讲 ， 一 个 逻辑 系统 越 丰富 ， 推 理 支 持 越 低 效 ， 时 常 越过 了 可 判定 性 的 界限 ; 也 就 是 说 ， 
在 这 种 逻辑 上 的 推理 不 能 保证 终止 。 因 此 我 们 需要 一 个 妥协 ， 一 种 可 以 被 相对 高 效 的 推理 机 

[oo] 支持 的 语言 ， 同 时 能 够 具有 足够 的 表达 能 力 来 表达 一 大 部 分 知识 。 
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4.3 OWL2 和 RDF/RDFS 的 兼容 性 


理想 情况 是 OWL2 作为 RDF 模式 的 扩展 ， 也 就 是 说 ，OWL2 采用 RDFS 含义 的 类 和 属性 
(rdfs:Class, rdfs:subClassof 等 )， 并 添加 语言 原 语 来 提供 所 需 的 更 丰富 的 表达 能 力 。 
这 种 方法 将 和 语义 网 的 分 层 体系 结构 一 致 (参见 图 1-4 ) 。 
不 幸 的 是 ， 简 单 地 扩展 RDF 模式 将 和 获得 更 强 、 更 高 效 的 推理 相 背 离 。RDF 模式 拥有 一 
些 非常 强大 的 建 模 原 语 。 例 如 rdfs :class( 所 有 类 的 类 ) 和 rdf:Propertyx 所 有 属性 的 类 ) 
的 结构 具有 很 强 的 表达 能 力 ， 如 果 OWL 的 底层 逻辑 以 一 般 形式 包含 这 些 原 语 ， 将 会 导致 不 
可 控 的 计算 性 质 。 
两 种 语义 
本 体 语言 的 完整 需求 集合 看 起 来 无 法 获得 : 高 效 的 推理 支持 能 够 支持 的 语言 的 表达 能 
力 无 法 达到 将 RDF 模式 和 一 种 完整 逻辑 组 合 的 程度 。 事 实 上 ， 这些 需求 导致 后 继 W3C T 
作 组 将 OWL2 分 为 两 个 不 同 的 子 语言 ， 各 自 拥 有 不 同 的 底层 语义 ， 面 向 满足 需求 全 集 的 不 同 
方面 。9S 
1. OWL2 Full: 基于 RDF 的 语义 
完整 的 语言 称 为 OWL2 Full， 并 且 使 用 所 有 的 OWL2 语言 原 语 。 它 也 允许 以 任意 方式 将 
这 些 原 语 与 RDF 和 RDF 模式 组 合 。 这 包括 了 通过 将 语言 原 语 用 于 其 他 原 语 来 改变 预定 义 的 
(RDF 或 OWL2 ) 原 语 的 含义 的 能 力 。 例 如 ， 在 OWL2 Full 中 ， 我 们 可 以 引入 一 个 基数 约束 
到 所 有 类 的 类 ， 这 本 质 上 限制 了 任意 一 个 本 体 中 可 以 描述 的 类 的 数目 。 
OWL2 Full 的 优点 在 于 它 被 映射 到 一 个 基于 RDF 的 语义 (RDF-based semantic)。 因 此 它 
在 结构 上 和 语义 上 完全 向 上 兼容 RDF : 任何 合法 的 RDF 文档 也 是 一 个 合法 的 OWL2 Full X 
档 ， 并 且 任 何 有 效 的 RDF 模式 推理 也 是 一 个 有 效 的 OWL2 Full 结论 。OWL2 Full 的 缺点 是 
这 个 语言 已 经 变 得 太 强 以 至 于 是 不 可 判定 的 ， 使 得 任何 完备 (或 高 效 ) 推理 支持 的 希望 都 破 
KT. 
2. OWL2 DL: 直接 语义 
为 了 重新 获得 计算 效率 ， 第 二 个 子 语言 OWL2 DL 被 映射 到 描述 逻辑 (DL) Eo HRR 
辑 是 谓词 逻辑 的 一 个 子 集 ， 它 使 得 高 效 的 推理 支持 成 为 可 能 。OWL2 DL 限制 了 OWL2, RDF 
Al RDFS 的 原 语 的 使 用 方式 。 一 些 限制 包括 : ' 
。 OWL2 DL 不 允许 OWL2 的 原 语 应 用 于 其 他 原 语 。 
。 其 次 , OWL2 DL 只 能 定义 非 文字 资源 的 类 。 所 有 OWL2 DL 类 是 owl :Class 的 实例 ， 
而 不 是 rdfs:Class 的 。 
© 再次，OWL2 DL 严格 区 分 了 值 域 包含 非 文字 资源 的 属性 和 关联 文字 值 的 属性 。 所 有 
OWL2 DL 属性 或 是 owl:0ObjectProperty 或 是 owl:DatatypeProperty 的 实 
例 ， 而 不 能 同时 是 两 者 的 实例 。 


日 ”OWL 的 第 一 个 版 本 包括 第 三 个 子 语言 ， 称 为 “OWL Lite”。 但是， 这 个 语言 被 4.5 节 中 介绍 的 “概要 ”所 
取代 。 
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。 最后， 在 OWL2 DL 中 ， 一 个 资源 不 能 同时 是 类 、 属 性 和 实例 。 它 们 可 能 拥有 相同 的 
名 字 (被 称 为 “双关 语 " (punning)), 但 是 总 能 根据 底层 逻辑 区 分 为 不 同 的 事物 。 
上 述 这 些 限制 保证 该 语言 维护 了 与 一 个 广泛 理解 的 描述 逻辑 之 间 的 直接 对 应 。 图 4-1 展 
示 了 OWL2 和 RDF/RDFS 的 一 些 建 模 原 语 之 间 的 子 类 联系 。 


rdfs:Literal 












`~ dajo 
图 4-1 OWL2 和 RDF/RDFS 之 间 的 子 类 联系 


这 种 受 限 的 表达 能 力 的 优势 在 于 它 允 许 高 效 的 推理 支持 。OWL2 DL 可 以 利用 大 量 现 有 的 
推理 机 ， 例 如 Pellet, FaCT, RACER 和 HermiT。 缺 点 在 于 我 们 失去 了 和 RDF 间 完 整 的 兼容 
性 。 一 个 RDF 文档 在 变 成 一 个 合法 的 OWL2 DL 文档 之 前 ， 通 常 将 不 得 不 以 某 种 方式 扩展 或 
以 另 一 些 方式 加 以 限制 。 但 是 每 个 合法 的 OWL2 DL 文档 是 一 个 合法 的 RDF 文档 。 

语义 网 的 分 层 体系 结构 (参见 图 1-4) 背后 一 个 主要 的 动机 是 希望 在 各 种 层次 之 间 向 下 兼 
容 对 应 软件 的 复 用 。 但 是 ， 对 于 OWL2 的 完整 向 下 兼容 性 〈 任 何 感知 OWL2 的 处 理 机 也 将 提 
供 任 意 RDF 模式 文档 的 正确 解释 ) 的 优势 只 能 通过 OWL2 Full 实现 ， 代 价 是 不 易 计算 性 。 

在 4.5 节 中 ， 我 们 将 继续 讨论 关于 OWL 的 3 个 额外 的 概要 ， 每 个 概要 将 寻求 表达 能 力 

和 高 效 推理 之 间 的 不 同 权衡 。 


44 ”OWL 语言 


这 节 介 绍 OWL2 的 语言 原 语 。 由 于 它 与 形式 逻辑 的 紧密 联系 ,采用 一 些 相关 的 词汇 表 很 
方便 : 
。 在 OWL2 中 ， 类 的 成 员 通 常 被 称 为 个 体 (individual) 而 非 实例 (instance), 但 是 我 们 将 
互 换 地 使 用 这 两 个 术语 。 
。 当 我 们 声明 某 个 资源 是 一 个 特定 类 型 时 ， 称 这 是 一 个 断言 (assertion)。 例 如 : 


:roger _ federer rdf:type :Person . 


是 一 个 类 断言 (class assertion)， 将 一 个 个 体 : roger_federer 关联 到 它 的 类 。 
© 当 我 们 组 合 类 、 属 性 和 实例 时 ， 它 们 形成 了 表达 式 (expression)。 例 如 : 
_:x rdf:type owl:Class ; 


owl:unionOf ( :Man ;Woman ) . 
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是 一 个 类 表达 式 (class expression)， 它 指出 了 一 个 (匿名 的 ) 类 是 :Man 和 :Woman 类 的 
并 集 。 
。 如 果 我 们 随后 将 这 个 定义 关联 到 我 们 的 某 个 类 ， 我 们 就 创建 了 公理 (axiom)。 例 如 : 
‘Person owl:equivalentClass _:x . 
Re owl:Class ; 


owl:unionOf ( :Man :Woman ) . 


是 一 个 等 价 类 公理 ， 它 声明 了 类 :Person 等 价 于 我 们 直接 引入 的 并 集 。 类 公理 有 时 也 称 为 

限制 (restriction)， 因 为 它们 对 可 以 作为 类 的 成 员 的 一 组 个 体 施加 了 约束 。 
记 住 OWL2 本 质 上 是 一 个 描述 事物 集合 的 语言 这 点 很 有 用 。 这 些 集 合 被 称 为 “类 ”。 我 

们 为 一 个 OWL2 类 产生 的 任何 声明 意味 着 将 这 个 类 和 所 有 事物 的 集合 区 别 开 。 


4.4.1 语法 


OWL2 建立 在 RDF 和 RDF 模式 之 上 ， 并且 可 以 使 用 所 有 合法 的 RDF 语法 来 表达 。 但 
是 ， 存 在 许多 OWL 语法 ， 每 个 都 有 优 缺 点 。 

函数 式 语法 ， 这 种 语法 和 本 体 的 形式 化 结构 关系 紧密 。 它 用 于 OWL2 的 语言 规范 文档 、 
OWL2 本 体 的 语义 定义 、 与 RDF 语法 的 相互 映射 ， 以 及 OWL2 的 不 同 概要 中 。 它 比 其 他 语 
法 更 加 紧凑 和 可 读 。 例 如 ， 上 面 的 类 约束 可 以 写成 下 面 的 语法 : 


EquivalentClasses( :Person ObjectUnionOf( :Man :Woman ) ) 


OWL/XML ”这 是 一 种 OWL2 的 XML 语法 ,但 是 它 不 遵从 RDF 习惯 ， 而 是 紧密 映射 到 
函数 式 语法 。9 这 种 语法 的 主要 优点 在 于 它 允 许 我 们 使 用 标准 的 现成 的 XML 编辑 工具 来 与 本 
体 交 互 。 例 如 ， 上 面 类 公理 的 等 价 OWL/XML 语法 如 下 : 


<EquivalentClasses> 
<Class abbreviatedIRI=":Person"/> 
<ObjectUnionOf> 


<Class IRI="#Man"/> 101 
<Class IRI="#Woman"/> 


</ObjectUnionOf> 


</EquivalentClasses> 


曼彻斯特 语法 ”这 种 语法 起 初 由 曼彻斯特 大 学 (University of Manchester) 开发 ， 设 计 得 
越 适 合 人 类 阅读 越 好 。 它 是 诸如 Protégé 在 内 的 当前 绝 大 多 数 本 体 编辑 器 在 用 户 界面 中 使 用 的 
语法 。 

Class: Person 


EquivalentTo: Man or Woman 


© OWL/XML 序列 化 被 定义 在 http://www.w3.org/TR/owl-xml-serialization/。 不 要 和 早期 的 OWL/XML 表示 语 
法 混淆 (定义 在 http:Wwww.w3.org/TR/owl-xmlsyntax)， 那 是 基于 OWL 第 1 版 的 抽象 语法 。 
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除了 这 些 语法 之 外 ， 所 有 RDF 语法 都 可 以 用 于 OWL。 因 此 ， 在 本 节 中 ， 我 们 依旧 使 用 
在 先前 章节 中 介绍 过 的 Turtle 语法 。 


4.4.2 ”本 体 文档 


当 使 用 Turtle 语法 时 ，OWL2 本 体 文档 ， 或 简单 地 称 为 本 体 ， 仅 仅 是 另 一 个 RDF 文档 。 
OWL2 本 体 最 少 包含 下 面 几 个 命名 空间 : 

@prefix owl: <http://www.w3.org/2002/07/owl#> . 

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . 

@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . 

@prefix xsd: <http://www.w3.org/2001/XMLSchema#> . 


一 个 针对 家 政 目的 的 OWL2 本 体 起 始 于 一 组 断言 。 这 些 断 言 介绍 了 一 个 基 命 名 空间 、 本 
体 本 身 、 它 的 名 字 、 可 能 的 注释 、 版 本 控制 以 及 包含 的 其 他 本 体 。 例 如 : 


@prefix : <http://www.semanticwebprimer.org/ontologies/apartments.ttl#> . 
@prefix dbpedia-owl: <http://dbpedia.org/ontology/> . 
@prefix dbpedia: <http://dbpedia.org/resource/> . 


@base <http://www.semanticwebprimer.org/ontologies/apartments.ttl> . 


<http://www.semanticwebprimer.org/ontologies/apartments.ttl> 
rdf:type owl:Ontology ; 
rdfs:label "Apartments Ontology" * xsd:string ; 
rdfs:comment "An example OWL2 ontology" ^ “xsd:string ; 
owl:versionIRI <http://www.semanticwebprimer.org/ontologies/apartments.ttl#1.0> ; 
owl:imports <http://dbpedia.org/ontology/> ; 


owl:imports <http://dbpedia.org/resource/> . 


Imports ”只 有 一 个 断言 会 影响 本 体 的 逻辑 含义 : owlL:imports， 它 指向 其 他 本 体 ， 
些 本 体 的 公理 也 是 当前 本 体 的 一 部 分 。 我 们 的 公寓 本 体 导入 了 被 定义 在 DBpedia ise 
有 公理 ， 以 及 DBpedia 本 身 的 所 有 事物 。 这 立刻 就 引发 了 owl:imports 的 一 个 问题 : AT 
能 够 使 用 DBpedia 中 的 部 分 信息 ， 我 们 不 得 不 导入 它 其 中 描述 的 所 有 6.72 亿 个 三 元 组 。 有 

命名 空间 仅 被 用 于 消除 歧义 ,而 被 导入 的 本 体 提供 了 可 以 被 使 用 的 定义 。 通 常 一 个 本 体 
对 每 个 它 所 使 用 的 命名 空间 包含 一 个 导入 声明 ,但 是 也 可 以 导入 额外 的 本 体 一 一 例如 ， 提 供 
定义 而 不 引入 新 名 称 的 本 体 。owl : imports 属性 是 传递 的 ， 也 就 是 说 ， 如 果 本 体 0; 引入 本 
体 O, TIRE O, 又 引入 本 体 O, IARI O 也 引入 本 体 Or。 


4.4.3 ”属性 类 型 
在 4.3.1 节 中 ， 我 们 讨论 了 OWL2 区 别 两 种 类 型 的 属性 : 对 象 (object) 属性 和 数据 类 型 


© MRZI http://dbpedia.org/About. 
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(datatype) 属性 。 事 实 上 ， 针 对 一 些 属 性 的 特征 ，OWL2 还 提供 了 额外 的 类 型 。 在 本 节 中 ,我 
们 将 概述 这 些 类 型 。 
对 象 属性 ”这 些 属性 将 个 体 与 个 体 关 联 。 例 如 ，: rents 和 :livesIn: 


:rents rdf:type owl:ObjectProperty ; 
rdfs:domain :Person ; 
rdfs:range ‘Apartment ; 


rdfs:subPropertyOf :livesin . 


数据 类 型 属性 ”这些 属性 将 个 体 与 一 种 数据 类 型 的 文字 值 关 联 。 例 如 ，:name 和 :age: 
:age rdf:type owl:DatatypeProperty ; 


rdfs:range xsd:nonNegativelnteger . 


正如 像 RDF 中 的 那样 ，OWL2 允许 使 用 XML 模式 中 的 数据 类 型 来 声明 一 个 文字 的 类 型 ， 
或 者 指定 一 个 数据 类 型 属性 的 值 域 。9 用 户 定义 的 数据 类 型 可 以 在 XML 模式 中 指定 ， 并 用 于 
OWL2 本 体 中 (参见 4.4.6 75). 

由 于 直接 语义 的 约束 ， 在 OWL2 DL 中 ,下 面 的 属性 类 型 中 只 有 函数 型 属性 〈functional 
property) 类 型 可 以 被 赋予 数据 类 型 属性 。 

标注 属性 ”标注 属性 是 一 些 不 携带 任何 OWL2 DL 直接 语义 含义 的 属性 。 也 就 是 说 ， 它 
们 被 一 个 描述 逻辑 推理 机 忽略 。 但 是 ， 会 在 RDF 模式 和 OWL2 Full 推理 机 中 考虑 它 。 

标注 属性 特别 用 于 为 OWL2 本 体 、 类 、 属 性 和 个 体 添 加 可 读 的 标签 、 注 释 或 解释 。 

:label rdf:type owl:AnnotationProperty . 

rdfs:range rdf:PlainLiteral . 


rdfs:subPropertyOf rdf:label 


:Apartment :label "Apartment" @en, 
"Appartement" @nl, 


"Avapépto pa" @el . 


上 面 的 例子 说 明了 几 件 事情 。 我 们 首先 定义 : label 属性 的 类 型 是 owl1 :Annotation- 
Property， 值 域 是 rdf :PlainLiteral。 这 是 一 个 针对 自然 语言 文本 的 特殊 RDF 数据 类 
型 ， 即 无 类 型 文字 可 以 拥有 一 个 语言 标签 。 我 们 接 下 来 定义 :label 属性 是 rafs:1abel 的 
一 个 子 属性 ， 并 且 给 Apartment 类 英语 、 荷 兰 语 和 和 希腊 语 三 种 标签 。 

通常 情况 下 ， 标 注 属性 将 拥有 文字 值 ， 但 是 它们 也 可 能 被 用 于 关联 非 文字 资源 。 

顶层 和 底层 属性 OWL2 中 的 所 有 对 象 属性 是 owl:topObjectProperty 的 子 属 性 。 
这 个 属性 被 定义 为 关联 本 体 中 所 有 个 体 的 属性 。 相 反 地 ，owl :bottomobjectProperty 
不 关联 任何 个 体 。 类 似 地 ，ow1l1 : topDataProperty 关联 所 有 个 体 到 任何 可 能 的 文字 值 ， 而 
owl:bottomDataProperty 不 关联 任何 个 体 到 任何 值 。 


O OWL2 引入 两 个 额外 的 数据 类 型 ，owl :real 和 owl:rational, 作为 xsd:decimal 的 超 类 。 
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传递 属性 从 rdfs:subclassof 的 讨论 可 知 ， 这 个 关系 是 传递 的 ; 每 个 类 是 
它 直 接 超 类 的 所 有 超 类 的 子 类 。 显 然 ， 存 在 其 他 关系 也 是 传递 的 ， 例 如 :isPartof 
或 :ischeaperThan。 我 们 可 以 用 下 面 的 方式 定义 一 个 属性 为 传递 的 : 


:isPartOf rdf:type owl:ObjectProperty ; 
105 rdf:type owl: TransitiveProperty . 


传递 属性 是 所 谓 的 复合 属性 (composite property): 它们 可 以 通过 多 步 被 声明 。 例 如 ， 


给 定 : 


:BaronWayApartment :isPartOf :BaronWayBuilding . 


:BaronWayKitchen :isPartOf :BaronWayApartment . 


一 个 推理 机 将 推导 : 


:BaronWayKitchen :isPartOf :BaronWayBuilding . 


最 后 一 个 :isPartof 关系 是 由 前 面 两 个 属性 断言 复合 而 成 。 因 为 这 种 复合 关系 ,传递 属性 
服从 一 些 约束 ,在 表 4-1 中 列 出 。 


表 4-1 复合 属性 的 约束 
何 时 属性 是 复合 的 ? 
© top 和 bottom 属性 都 是 复合 的 
。 任意 属性 自身 是 传递 的 ， 或 者 有 一 个 逆 属性 是 传递 的 
。 任意 属性 拥有 一 个 传递 的 子 属性 ， 或 者 子 属性 的 逆 属性 是 传递 的 
。 任意 属性 是 一 个 属性 链 (property chain) 的 超 属性 ， 或 者 是 一 个 属性 链 的 超 属 性 的 逆 属 性 
。 任意 属性 是 以 上 某 种 属性 的 等 价 属性 ， 或 者 是 以 上 某 种 属性 的 等 价 属性 的 超 属性 
复合 属性 有 时 也 称 为 复杂 角色 (complex roles) 或 非 简单 (non-simple) 属性 
限制 
复合 属性 不 能 出 现在 以 下 公理 中 : 
。 类 上 的 限定 和 非 限 定 基 数 限制 
。 类 上 的 自 限 制 
。 不 相交 的 属性 公理 
而 且 ， 它 们 不 能 被 赋予 以 下 属性 类 型 ; 
。 函数 型 或 反 函 数 型 
。 反 自 反 的 
o 非 对 称 的 


对 称 和 非 对 称 属 性 某 些 属性 ， 例 如 :isadjacentTo， 是 对 称 的 ; 也 就 是 说 ， 如 果 
a:isAdjacentTo bp， 则 反 过 来 也 成 立 。 换 名 话说 ， 对 称 属 性 和 它们 的 逆 等 价 (参见 4.4.4 
节 )。 对 于 其 他 属性 ， 我 们 知道 这 可 能 不 成 立 。 例 如 ，:ischeaperThan 关系 是 非 对 称 的 ， 
因为 没有 人 能 够 被 他 们 击败 的 人 所 击败 S。 
:isAdjacent To rdf:type owl:ObjectProperty ; 


rdf:type owl:SymmetricProperty . 


日 ”当然 ,这 只 在 每 对 人 只 允许 进行 一 场 比赛 的 情况 下 成 立 。 
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tisCheaperThan rdf:type owl:ObjectProperty ; 
rdf:type owl:AsymmetricProperty ; 


rdf:type owl: TransitiveProperty . 


函数 型 和 反 函 数 型 属性 对 于 某 些 属性 ， 我 们 知道 每 个 个 体 通 过 该 属性 总 是 最 多 存在 另 
一 个 相关 个 体 。 例 如 ，:hasNumberOfRooms 是 一 个 函数 型 属性 ， 而 :hasRoom 属性 是 反 
:hasNumberOfRooms rdf:type owl:DatatypeProperty ; 


rdf:type owl:FunctionalProperty . 


:hasRoom rdf:type owl:ObjectProperty ; 


rdf:type owl:InverseFunctionalProperty . 


注意 ， 如 果 两 个 公寓 a 和 a, 通过 :hasRoom 关联 到 相同 的 房间 +， 这 个 不 一 定 是 不 一 致 的 : 
这 些 个 体 可 以 被 推断 为 相同 的 。 
自 反 和 反 自 反 属 性 一 个 属性 的 自 反 性 意味 着 每 个 个 体 通过 该 属性 关联 到 自身 。 例 如 ， 
每 个 事物 :isPartof 其 自身 。 另 一 方面 ， 反 自 反 性 意味 着 没有 个 体 通过 该 属性 关联 到 自身 。 
大 多 数 定义 域 和 值 域 不 相交 的 属性 事实 上 是 反 自 反 的 。 一 个 例子 是 : rents 属性 : 107 
:isPartOf rdf:type owl:ObjectProperty ; 
rdf:type owl:ReflexiveProperty . 


:rents rdf:type owl:ObjectProperty ; 
rdf:type owl:IrreflexiveProperty . 


444 ”属性 公理 


除了 之 前 章节 中 介绍 的 属性 类 型 外 ， 我 们 能 够 根据 属性 与 类 及 其 他 属性 如 何 关联 来 指定 
属性 的 额外 特性 。 一 些 和 RDF 模式 中 的 相 类 似 ; 而 另 一 些 则 完全 是 新 的 。 

定义 域 和 值 域 在 4.4.3 节 中 我 们 已 经 看 到 ，OWL2 处 理 属性 的 定义 域 和 值 域 的 方式 与 
RDF 模式 一 样 。 如 果 一 个 属性 断言 了 超过 一 个 rdfs:range M rdfs:domain, 实际 的 值 域 
或 定义 域 是 在 属性 公理 中 指定 的 类 的 交集 。 

一 个 常见 的 误解 是 将 定义 域 和 值 域 用 作 约 束 ， 约束 了 可 能 通过 一 个 属性 关联 的 个 体 类 型 。 
事实 上 ， 定 义 域 和 值 域 只 能 用 于 确定 这 些 个 体 的 类 成 员 关系 。 考 虑 上 面 的 :rents 定义 , fE 
意 两 个 个 体 p 和 a 满足 p:rentsa, 将 被 各 自分 类 为 :Person 和 :Apartment 的 成 员 。 

逆 属 性 ”OWL2 允许 我 们 定义 属性 的 道 。 一 个 常见 的 例子 是 :rents 和 :isRentedBy 
属性 对 。 例 如 : 

:isRentedBy rdf:type owl:ObjectProperty ; 


owl:inverseOf :rents . 


这 意味 着 一 个 推理 机 将 确定 两 个 个 体 p 和 m， 它们 除了 拥有 p:rents m, GHA 
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m:isRentedByp。 定 义 域 和 值 域 从 道 属性 继承 下 来 : :isRentedBy 有 :Person 作为 值 域 ， 
而 :Apartment 作为 定义 域 。 在 OWL2 DL 中 ， 只 有 对 象 属性 才能 拥有 逆 属 性 。 

等 价 属性 ”属性 也 可 以 被 定义 为 等 价 的 。 也 就 是 说 ， 每 两 个 通过 某 属 性 关联 的 个 体 总 是 
通过 它 的 等 价 属性 关联 ， 反 之 亦 然 。 等 价 性 是 一 种 方便 地 将 不 同 本体 中 的 元 素 相 互 映 射 的 机 
制 。 例 如 : 


:isPartOf rdf:type owl:ObjectProperty ; 


owl:equivalentProperty dbpedia:partOf . 


不 相交 属性 ”对 于 一 些 属性 ， 我 们 知道 两 个 个 体 可 以 通过 一 个 属性 相关 联 ， 则 不 可 能 通 
过 另 一 个 : 拥有 属性 的 个 体 对 的 集合 是 不 相交 的 。 例 如 :rents 和 :owns 属性 : 


:rents rdf:type owl:ObjectProperty ; 
rdfs:domain :Person ; 
rdfs:range :Apartment ; 


owl:disjointProperty :owns . 


显然 ， 你 不 能 租 某 些 你 拥有 的 东西 。 注 意 ,在 OWL2 DL 的 直接 语义 下 ，ow1 :Object- 
Property 和 owl :DatatypeProperty 也 是 不 相交 的 。 

属性 链 OWL2 的 一 个 更 加 复杂 的 特性 是 定义 属性 的 链 (chain) 的 能 力 。 有 时 指 
定 关 联 各 种 个 体 的 属性 的 图 的 捷径 是 有 用 的 。 例 如 ， 如 果 我 们 知道 :Paul :rents 
:BaronWayApartment, 同时 :BaronWayApartment :isPartOf :BaronWayBuilding, 
EW dbpedia:location 是 abpedia:Rmsterdam， 则 我 们 知道 :Paul 必然 含有 一 
个 :livesIn 关系 到 :Amsterdam。 在 OWL2 中 ， 我 们 可 以 通过 属性 链 公 理 来 指定 这 种 
关系 : 


:vesln rdf:type owl:ObjectProperty ; 
owl:propertyChainAxiom ( :rents :isPartOf ‘location ) . 
图 4-2 展示 了 :1ivesIn 关系 如 何 通过 公寓 例子 推导 得 到 。 注 意 ， 属 性 链 公理 不 能 使 命 
名 属性 ( :1ivesIn) 等 价 于 属性 链 ; 它 更 像 是 链 的 一 个 子 属性 。 在 OWL2 DL 中 ， 属 性 链 值 
只 允许 涉及 对 象 属性 ， 虽 然 绝 大 多 数 推理 机 能 够 在 最 后 处 理 拥有 数据 类 型 属性 的 链 。 


| :BaronWayApartment | :BaronWayBuilding | 


_-- ‘livesin ~--、 l 


:iSPartOf 
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图 4-2 属性 链 (虚线 由 推理 机 推导 得 到 ) 
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出 于 表达 能 力 ， 属 性 链 需 要 服从 一 些 约束 。 首 先 ， 和 传递 属性 类 似 ， 属 性 链 的 超 属性 是 
复合 的 。 这 意味 着 它们 不 能 使 用 一 些 公理 (参见 表 4-1 )。 其 次 ， 属 性 链 不 能 是 递归 的 ; 链 的 
超 属 性 、 它 的 逆 或 它 的 一 个 子 属性 (或 子 属性 的 逆 ) 不 能 出 现在 属性 链 公 理 中 。 例 如 ,OWL2 
DL 不 允许 我 们 以 下 面 的 方式 扩展 :1ivesIn 属性 : 

‘livesin rdftype owl:ObjectProperty ; 

owl:propertyChainAxiom ( :rents :isPartOf dbpedia-owl:location ) ; 


owl:propertyChainAxiom ( ;livesln dbpedia-owl:country ) . 


尽管 它 允 许 我 们 推导 出 ， 因 为 :Paul 居住 在 abpedia:amsterdam， 他 也 必须 居住 在 
dbpedia:Netherland, 


445 ”类 公理 

类 通过 断言 某 个 资源 的 类 型 是 owl :Class 来 定义 。 存 在 两 个 预定 义 的 类 在 推理 中 起 重 
要 作用 : owl:Thing 和 owl:Nothing。 前 者 是 最 一 般 的 类 ; 每 个 可 能 的 OWL2 个 体 都 是 
这 个 类 的 成 员 ， 而 owl:Class 的 每 个 实例 都 是 owl: Thing MFA. owl:Nothing 类 是 
空 类 ， 它 没有 成 员 ， 并且 owl:Class 的 每 个 实例 都 是 该 类 的 超 类 。 不一致 的 类 不 能 拥有 任 
何 成 员 ， 因 而 等 价 于 ow1 :Nothing。 注 意 ，owl1 :Thing 的 约束 拥有 非常 深远 的 影响 : 它们 
对 于 本 体 的 每 个 类 和 个 体 都 成 立 。 

子 类 关系 子 类 关系 的 定义 和 RDF 模 式 中 类 似 。 例 如 ,我们 可 以 定义 一 个 
类 :LuxuryApartment MF: 


:LuxuryApartment rdf:type owl:Class ; 
rdfs:subClassOf :Apartment . 


类 等 价 类 的 等 价 意味 着 一 个 类 的 每 个 成 员 也 必须 是 等 价 类 的 成 员 ， 反 之 亦 然 。 换 句 话 
说 ， 两 个 类 涵盖 了 完全 一 样 的 个 体 集合 。 类 等 价 可 以 通过 使 用 owl sequivalentClasss 属 
性 定义 : 


:Apartment owl:equivalentClass dbpedia:Apartment . 


这 声明 了 在 我 们 的 公寓 本 体 中 的 :Apartment 类 和 从 DBpedia 导入 的 dbpedia: Apartment 
类 等 价 。 断 言 类 之 间 的 等 价 关 系 等 价 于 断言 双向 的 子 类 关系 : 


:Apartment rdfs:subClassOf dbpedia:Apartment . 


dbpedia:Apartment rdfs:subClassOf :Apartment . 


小 插曲 : 双关 语 你 可 能 注意 到 DBpedia apartment 的 定义 来 源 于 dbpedia 命名 空间 ， 而 
不 是 源 自 dbpedia-owl。 真 正 的 它 不 是 一 个 类 ， 而 是 一 个 个 体 。 

对 比 我 们 的 本 体 ，DBpedia 在 更 高 的 抽象 层次 上 描述 了 公寓 。DBpedia 本 体 中 的 类 不 试 
图 分 类 个 体 实体 (例如 Amsterdam 的 公寓 )， 而 是 分 类 个 体 主 题 。 将 个 体 作 为 类 称 为 元 建 模 


(meta-modeling )。 
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虽然 OWL2 的 直接 语义 不 允许 元 建 模 ，OWL2 DL 通过 一 个 称 为 双关 语 (或 “文字 游戏 ”) 
的 语法 技巧 绕 过 这 个 限制 。 这 意味 着 ， 当 URI dbpedia:Apartment 出 现在 类 公理 定义 中 
时 ， 它 就 被 当做 类 ， 而 当 它 出 现在 个 体 断 言 中 时 ， 它 就 被 当做 个 体 。 

双关 语 人 允许 用 在 下 面 的 情况 中 : 类 的 名 字 、 个 体 的 名 字 和 属性 的 名 字 可 以 自由 地 互 换 。 
但 是 对 象 属性 名 和 数据 类 型 属性 名 不 可 以 混用 。 

WH ”最 直接 (尽管 无 意义 且 计 算 昂 贵 ) 的 方式 来 定义 类 ， 可 以 通过 显 式 的 枚 举 它 包 含 的 
所 有 个 体 : 


:BaronWayRooms rdf:type owl:Class; 
owl:oneOf ( :BaronWayKitchen 
:BaronWayBedroom1 
:BaronWayBedroom2 
:BaronWayBedroom3 
:BaronWayLivingroom 
:BaronWayBathroom 
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这 定义 了 Amsterdam 所 有 公寓 的 类 。 或 许 ， 如 果 已 知 的 成 员 列 表 很 长 ， 这 种 类 定义 方式 
是 非常 笨重 的 ， 而 且 如 果 我 们 当前 不 能 知道 所 有 的 个 体 ， 这 种 方式 甚至 是 不 可 行 的 。 例 如 ， 
我 们 可 能 决定 把 : BaronWayBedrooml 和 :BaronWayBedroom2 之 间 的 墙 敲 掉 ， 来 创建 一 
个 新 的 房间 。 : 

不 相交 类 类 的 不 相交 性 意味 着 一 个 类 的 成 员 不 可 能 也 是 男 一 个 类 的 成 员 。 通 过 
两 个 类 描述 的 个 体 集合 不 含 交 集 。 我 们 可 以 通过 使 用 owl:disjointWith 属 性 来 声 
明 :LuxuryApartment 类 和 :ColdWaterFlat 9 不 相交 。 


:LuxuryApartment owl:disjointWith :ColdWaterFlat . 


这 意味 着 没有 :LuxuryApartment 可 以 同时 是 :coldWaterFlat. 

补 一 个 类 4 的 补 C 是 所 有 不 属于 4 的 事物 的 类 。 换 句 话 说 , 4 和 C 的 并 集 等 价 于 
owl :Thing。 注 意 ,这 意味 着 补 总 是 4 的 不 相交 类 的 超 集 。 记 住 互补 性 是 一 个 很 强大 的 建 模 
结构 ， 必 须 小 心 使 用 这 点 很 重要 。 例 如 : 

:FurnishedApartment rdfs:subClassOf :Apartment . 


:UnFurnishedApartment rdfs:subClassOf :Apartment ; 


owl:complementOf :FurnishedApartment . 


这 声明 了 有 家 具 的 公寓 类 是 没有 家 具 的 公寓 类 的 补 。 如 果 我 们 的 本 体 包含 除了 公寓 之 外 的 其 
他 类 ， 那 么 就 有 问题 了 。 例 如 ， 如 果 我 们 额外 声明 : 


:SemiDetached owl:disjointWith :Apartment . 


O “一 个 冷水 公寓 是 没有 热 水 供 应 的 公寓 。 
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:SemiDetached 类 将 会 为 空 。 为 什么 ”如 果 类 :Apartment 同时 涵盖 : Funished- 
Apartment 和 它 的 补 ， 那 么 :Apartment 将 等 价 于 owl :Thing : 不 可 能 存在 一 个 个 体 既 
不 属于 某 个 类 也 不 属于 它 的 补 。 如 果 我 们 另外 引入 一 个 和 :Apartment 不 相交 的 类 ， 这 个 
类 在 效果 上 和 owl:Thing 不 相交 。:Semipetached 类 不 能 包含 任何 个 体 ， 因 此 等 价 于 
owl:Nothing. . 

并 集 和 不 相交 并 集 ”我 们 经 常 知道 某 个 类 等 价 于 两 个 或 两 个 以 上 类 : 该 类 的 每 个 成 员 都 
至 少 是 并 集中 一 个 类 的 成 员 。 这 可 以 使 用 owl:unionof 结构 来 指定 。 例 如 : 


:Apartment rdf:type owl:Class ; 

owl:unionOf ( :ColdWaterFlat 
:LuxuryApartment 
:PenthouseApartment 
:StudioApartment 
:BasementApartment 
:FurnishedApartment 
:UnFurnishedApartment 


Js 


在 许多 情况 下 ， 并 集 的 成 员 类 是 互 不 相交 的 。 当 然 ， 我 们 可 以 显 式 地 断言 类 之 间 的 
owl:disjointWith 关系 ,但 是 直接 声明 则 更 加 方便 : 
:Apartment rdf:type owl:Class; 
owl:disjointUnionOF ( 
:FurnishedApartment 


:UnFurnishedApartment ) . 


交集 ”类似 地 ， 我 们 可 以 声明 一 个 类 是 两 个 或 者 多 个 类 的 交集 : 这 个 类 的 每 个 成 员 是 交 
集中 每 个 类 的 成 员 。 例 如 : 
:LuxuryApartment 
rdf:type owl:Class ; 
owl:intersectionOf ( :GoodLocationApartment 
:LargeApartment 
:NiceViewApartment 


:LuxuryBathroomApartment ) . 
这 声明 了 :LuxuryApartment 类 是 由 拥有 好 的 地 点 、 大 空间 、 优美 的 风景 以 及 豪华 浴室 的 
个 体 公 寓 组 成 。 
4.4.6 ”属性 上 的 类 公理 


OWL2 允许 比 我 们 在 前 面 章 节 中 看 到 的 更 加 精细 的 控制 类 的 定义 。 我 们 可 以 指定 额外 
的 类 公理 来 约束 个 体 集合 ， 这 些 个 体 通过 观察 它们 的 属性 被 认为 是 某 个 类 的 成 员 。 例 如 ， 
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这 使 得 我 们 自动 地 推导 类 成 员 关 系 。 类 限制 公理 通过 关联 到 一 个 特别 类 型 的 匿名 类 (在 
Turtle 中 ， 一 个 owl:Restriction) 被 连接 到 一 个 owl :Class， 它 将 所 有 满足 限制 的 个 
体 聚 集 在 一 起 。 

全 称 限制 ”在 一 个 类 C 和 属性 p 上 的 全 称 限制 声明 对 于 C 的 每 个 成 员 , p 的 所 有 值 都 属 
于 某 个 类 。 换 句 话 说， 全称 限 制 可 以 用 于 指定 一 个 属性 的 值 域 ， 这 个 值 域 对 于 受 约束 的 类 而 
言 是 局 部 的 。 这 个 类 型 的 约束 使 用 owl: allValuesFrom 结构 来 建立 。 例 如 : 


:LuxuryBathroomApartment 
rdf:type owl: Class; 
rdfs:subClassOf [ rdf:type owl:Restriction; 
owl:onProperty :hasBathroom ; 
owl:allValuesFrom :LuxuryBathroom 


|. 


这 定义 了 :LuxuryBathroomApartment 类 作为 个 体 集合 的 一 个 子 类 ， 对 于 shasBathroom 
属性 的 取 值 只 能 是 :LuxuryBathroonm 的 实例 。 注 意 , 一 个 owl:allvaluesFrom 限制 仅 
仅 声 明了 ， 如 果 受 限 类 的 某 个 成 员 拥 有 某 个 属性 的 值 ， 那 么 这 个 值 必须 是 特定 类 的 成 员 。 这 
个 限制 不 要 求 属性 必须 含有 任何 值 : 在 这 种 情况 下 ， 这 个 限制 被 无 意义 地 满足 。 在 我 们 的 公 
富 例 子 中 ， 上 面 的 定义 不 要 求 一 个 蒙 华 浴室 公寓 必定 拥有 一 个 浴室 ! 

全 称 限制 也 可 以 用 于 数据 类 型 属性 一 一 例如 ， 声 明 一 个 属性 的 值 必 须 是 某 种 类 型 ,或 者 
落 入 某 种 数据 值 域 中 ( 见 后 )。 

存在 限制 ”一 个 类 C 和 属性 p 上 的 存在 限制 声明 对 于 C 的 每 个 成 员 ， 至 少 存在 疡 的 某 个 
值 属于 某 个 特定 类 。 这 种 类 型 的 限制 使 用 owl : someValuesFrom 关键 词 来 指明 : 


:LuxuryBathroomApartment 
rdf:type owl:Class; 
rdfs:subClassOf [ rdf:type owl:Restriction; 
owl:onProperty = :hasBathroom ; 


owl:someValuesFrom :LuxuryBathroom 


]- 


必要 和 充分 条 件 如果 不 使 用 rdfs:subclassof 属性 来 将 我 们 的 类 关联 到 限制 ， 我 
们 也 可 以 使 用 owl:equivalentclass 属 性 来 声明 这 个 受 限 类 恰好 是 限制 描述 的 类 。 
rdfs:subClassOf 限制 声明 了 类 成 员 的 必要 条 件 ， 而 owl:equivalentClass 则 声明 了 
必要 和 充分 条 件 。 

一 般 而 言 ， 一 个 推理 机 只 基于 充分 必要 条 件 来 直接 推导 个 体 的 类 成 员 关 系 。 例 
如 ， 上 面 的 存在 限制 不 会 使 得 推理 机 得 出 下 面 的 结论 ， 每 个 拥有 :hasBathroom 关 系 
到 :LuxuryBathroom 类 型 个 体 的 实例 必须 是 :LuxuryBathroomApartment 的 实例 。 这 
个 公寓 只 是 这 个 限制 的 子 类 ， 而 我 们 没有 足够 的 信息 来 确定 个 体 也 是 类 本 身 的 成 员 。 如 果 我 
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们 使 得 这 个 类 与 限制 指定 的 类 等 价 ， 很 明显 任何 满足 限制 的 个 体 也 必 是 类 的 成 员 。 

但 是 ， 在 这 两 种 情况 下 ， 如 果 我 们 显 式 地 声明 一 个 个 体 是 :LuxuryBathroomApartment 
类 的 一 个 实例 ， 推 理 机 将 会 推导 出 至 少 存在 某 个 (未知 的 ) :LuxuryBathroom 类 型 的 个 体 
作为 :hasBathroom 属性 的 值 。 

值 限制 ” 值 限制 用 于 当 我 们 想 基 于 与 已 知 个 体 的 关系 或 与 特定 数据 类 型 属性 取 值 的 关系 
来 定义 类 时 。 例 如 ， 我 们 可 以 定义 Amsterdam 的 所 有 公寓 的 类 : 





:AmsterdamApartment 
rdf:type owl:Class; 
owl:equivalentClass [ rdf:type owl:Restriction; 


owl:onProperty dbpedia-owl:location ; 
owl:hasValue dbpedia:Amsterdam 


|. 


基数 限制 ”一 个 基数 限制 约束 了 对 于 一 个 类 而 言 某 个 属性 可 以 拥有 的 值 的 数目 。 如 果 我 
们 额外 指定 这 些 值 必须 属于 的 类 ， 那 么 这 个 约束 就 被 称 为 是 限定 的 (qualified). fil Ml: 
:StudioApartment 
rdf:type owl:Class; 
rdfs:subClassOf [ rdf:type owl:Restriction; 
owl:onProperty :hasRoom ; 


owl:cardinality "1"^^xsd:integer 


J; 


这 指定 了 一 个 单间 公寓 只 能 有 一 个 :hasRoom 属性 的 值 。 我 们 可 以 将 其 改 为 限定 的 基数 
限制 ， 通 过 声明 这 个 基数 只 对 :LivingRoom、:Kitchen 和 :Bedroom 类 的 成 员 成 立 ( 单 
间 通 常 确实 包含 独立 的 卫生 间 ): 


:StudioApartment 


rdf:type owl:Class; 
rdfs:subClassOf [ rdf:type owl:Restriction; 
owl:onProperty sisPlayedBy ; 


owl:qualifiedCardinality "1" ^ ~xsd:integer ; 
owl:onClass [ owl:unionOf (:LivingRoom :Kitchen :Bedroom) ] 
i 
注意 ， 限 定 限 制 依然 允许 受 限 类 的 成 员 拥有 属性 的 额外 值 ， 只 要 这 些 属于 受 限 类 的 补 。 一 个 
在 owl: Thing 上 的 受 限 的 基数 限制 等 价 于 一 个 没有 限定 的 约束 。 表 4-2 罗列 了 OWL 中 允 
许 的 不 同 基数 限制 。 
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R 4-2 OWL2 中 的 基数 限制 


owl:qualifiedCardinality 
owl: qualifiedMinCardinality 


owl:qualifiedMaxCardinality 


数据 值 域 限制 和 数据 类 型 ”针对 数据 类 型 属性 的 全 称 和 存在 限制 允许 一 个 类 的 成 员 指定 
数据 类 型 中 的 任何 值 作 为 属性 的 值 。 有 时 ， 我 们 需要 更 精确 的 定义 ， 例 如 ， 人 允许 租 公 寓 的 成 
人 类 ， 或 者 公寓 的 最 小 面积 。 在 OWL2 中 ,我 们 可 以 指定 一 个 属性 所 允许 的 值 域 的 限制 : 


















限制 的 类 型 


Exact cardinality 







owl:cardinality 


Minimum cardinality owl:minCardinality 


Maximum cardinality owl:maxCardinality 


:Adult — rdfs:subClassOf dbpedia:Person ; 
rdfs:subClassOf [ rdf:type owl:Restriction ; 
owl:onProperty :hasAge ; 
owl:someValuesFrom 
[ rdf:type rdfs:Datatype ; 
owl:onDatatype xsd:integer ; 
owl:withRestrictions ( 
[ xsd:minInclusive "18" ^ *xsd:integer ] 
) 
] 
Ja 


这 定义 了 :Adult 作为 人 的 子 类 ， 拥 有 :hasage 的 值 并 属于 大 于 等 于 18 的 整数 值 域 。 你 可 
以 看 到 这 个 数据 值 域 被 定义 为 rdfs:Datatype 类 型 的 一 个 匿名 类 。 我 们 也 可 以 引入 一 个 新 
的 命名 数据 类 型 ， 使 得 我 们 在 本 体 中 可 以 重用 : 
:AdultAge rdf:type rdfs:Datatype ; 
owl:onDatatype xsd:integer ; 
owl:withRestrictions ( 
[ xsd:minInclusive "18" * *xsd:integer ] 


PG 
‘Adult rdf:type owl:Class ; 


rdfs:subClassOf dbpedia:Person ; 
rdfs:subClassOf [ rdf:type owl:Restriction ; 
owl:onProperty :hasAge ; 
owl:someValuesFrom :AdultAge 
His 
OWL2 允许 使 用 XML 模式 来 定义 数据 类 型 。 但 是 ， 只 有 使 用 XML 模式 刻 面 (facets) 定 
义 的 数据 类 型 才能 用 于 限制 中 。 参 见 建议 阅读 来 获得 更 多 信息 。 
自 限制 ”我 们 都 知道 好 的 公寓 可 以 自 卖 ; 如 果 它 拥有 好 的 位 置 ， 有 好 的 风景 ， 并 且 拥 有 
合适 的 大 小 ， 不 需要 花 太 多 时 间 来 重新 装修 就 可 以 卖 得 很 好 。 在 OWL2 中 ， 我 们 可 以 使 用 自 
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限制 来 表达 这 点 。 例 如 : 


ex:GoodApartment 
rdf:type owl:Class ; 
tdfs:subClassOf [ rdf:type owl:Restriction ; 
owl:onProperty ex:sells ; 
owl:hasSelf "true" * *xsd:boolean ; 


它 声明 了 ex:GoodApartment 的 每 个 实例 都 通过 ex:sells 属性 关联 到 它 自 身 。 显 然 ， 
OWL2 不 允许 数据 类 型 属性 的 自 约束 。 

键 ” 数 据 库 经 常 使 用 键 来 标识 表 中 的 记录 。 这 些 键 不 必 是 URI， 并 且 很 难 使 用 一 个 优雅 
的 转换 策略 生成 。OWL2 允许 我 们 声明 ， 对 于 某 个 类 (看 做 是 表 )， 一 个 特定 的 数据 类 型 属性 ”[120 
(或 者 属性 组 合 ) 的 值 应 该 被 作为 一 个 唯一 标识 符 。 例 如 ， 邮 编 和 街道 门牌 号 码 的 组 合 为 荷兰 
的 所 有 住所 提供 了 一 个 唯一 的 标识 符 : 


:postcode rdf:type  owl:DatatypeProperty . 
:addressNumber rdf:type  owl:DatatypeProperty . 


:Dwelling 
rdf:type owl: Class ; 


owl:hasKey ( :postcode :addressNumber ) . 


注意 ， 这 种 键 的 机 制 允许 我 们 定义 局 部 作用 于 某 个 类 的 反 函 数 型 数据 类 型 属性 。 任 意 两 个 类 
型 为 ex:Dwelling 的 个 体 ， 如 果 拥 有 相同 的 :postcode 和 :addressNumber fA, iE 
被 认为 是 相同 的 个 体 。 不 幸 的 是 ，OWL2 DL 由 于 计算 代价 的 原因 ， 不 允许 我 们 指定 全 局 的 反 
函数 型 数据 类 型 属性 。 


4.4.7 个 体 事实 

现在 我 们 已 经 有 了 在 OWL2 中 如 何 定义 属性 和 类 的 一 般 方 法 ,现在 将 注意 力 转移 到 模型 
中 的 个 体 实体 。 在 许多 情况 下 ,我 们 已 经 拥有 了 许多 关于 这 些 实体 的 知识 ， 并 且 只 需要 类 公 
理 来 推导 额外 信息 。 关 于 个 体 的 声明 通常 称 为 断言 。 

类 和 属性 断言 OWL2 中 的 类 成 员 关 系 和 属性 断言 与 RDF 模式 中 的 声明 方式 一 样 : 


:Apartment rdf:type owl:Class . 


:BaronWayApartment rdf:type :Apartment ; 
:hasNumberOfRooms "4" ^ *xsd:integer ; 


:isRentedBy :Paul . 121 


这 引入 了 :BaronWayApartment， 它 是 类 :Apartment 的 一 个 实例 。 它 拥有 4 个 房 
间 ， 出 租 给 :Paul。 记 住 在 OWL2 DL 的 直接 语义 下 ，rdf:type 关系 只 能 在 两 个 严格 区 分 
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的 层次 下 成 立 :， 即 类 之 间 和 个 体 之 间 9。 
同一 性 (Identity) 断言 因为 OWL2 采用 开放 世界 假设 ,我 们 永远 不 能 假设 拥有 不 同 
URI 的 两 个 个 体 是 不 同 的 实体 。 我们 可 能 是 处 理 一 个 拥有 多 个 名 字 的 单一 个 体 。 虽 然 我 们 已 
经 在 一 些 情况 中 看 见 了 可 以 自动 地 推导 出 同一 性 关系 ， 显 式 地 声明 它 有 时 更 加 方便 : 
:BaronWayApartment owl:sameAs :PaulsApartment ; 


owl:differentFrom :FranksApartment . 


不 同 个 体 的 列表 很 容易 变 得 很 长 。 例 如 ， 一 个 小 型 城市 已 经 包含 了 数 百 个 公寓 ， 使 得 
我 们 需要 用 owl:differentFrom 关 系 来 成 对 地 断言 它们 。 幸 运 的 是 ， 我们 可 以 使 用 
owl:AllDifferent 结构 稍微 优雅 点 地 声明 它们 : 

_ix rdf'type owl:AllDifferent ; 


owl:members ( :FranksApartment :PaulsApartment ) . 


AMS 有 了 时 我 们 知道 某 些 事 物 不 成 立 。 在 开放 世界 中 ,将 这 些 知识 显 式 化 很 有 价值 : 
排除 可 能 性 常 允许 我 们 推导 出 新 的 知识 。 例 如 , :BaronWayApartment 没有 出 租 给 :Frank 
的 知识 可 能 允许 我 们 推断 出 它 不 是 :FranksApartment: 

_:X rdf:type owl:NegativePropertyAssertion ; 

owl:sourcelndividual :BaronWayApartment ; 
owl:assertionProperty :isRentedBy ; 


owl:targetIndividual :Frank . 


如 果 owl:assertionProperty 指 向 的 是 数据 类 型 属性 ， 要 用 owl: targetValue 来 代 
替 owl:targetIndiviadual。 

注意 ， 如 果 我 们 知道 一 个 个 体 不 是 某 个 类 的 成 员 ， 也 可 以 通过 断言 它 是 该 类 的 补 的 成 员 
来 显 式 地 断言 这 点 : 


:BaronWayApartment rdf:type [ owl:complementOf :LuxuryApartment ] . 


4.5 OWL2 概要 


OWL2 规范 包括 一 组 称 为 概要 的 内 容 : 它们 中 的 一 些 是 OWL2 DL 规范 中 著名 的 子 集 ， 
而 另 一 些 更 具 表 达能 力 ， 但 是 不 含 OWL2 Full 的 完整 语义 。 提 供 这 些 概要 的 动机 是 许多 已 有 
本 体 倾 向 于 只 使 用 DL 中 可 用 的 语言 结构 的 一 个 特定 部 分 。 基 于 一 个 较 弱 表达 能 力 语言 的 推 
理 能 够 实现 推理 机 性 能 的 显著 提高 。 逻 辑 概要 的 标准 库 以 及 特别 受 欢 迎 的 表达 能 力 和 计算 复 
杂 性 之 间 的 权衡 在 现实 中 很 有 用 。 

特别 地 ， 这 些 概 要 包括 : 

1 ) 通过 语法 来 限制 。 一 个 概要 语法 的 语义 由 OWL2 DL 规范 提供 。 

2 ) 通过 人 逻辑 来 定义 ,使 其 能 够 在 多 项 式 时 间 内 处 理 一 些 有 趣 的 推理 服务 ， 关 平 于 : 
”© 参见 4.4.5 节 中 有 关 双 关 语 的 讨论 。 
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。 本体 中 事实 的 数目 。 

。 本 体 的 整体 大 小 。 

本 节 将 概述 OWL2 中 定义 的 概要 以 及 它们 的 典型 应 用 领域 。 

OWL2 EL El 概要 是 入 描述 逻辑 的 扩展 。 它 的 主要 优势 在 于 可 以 用 多 项 式 时 间 推 理 拥 
有 大 量 类 公理 的 本 体 ， 它 被 设计 用 于 涵盖 卫生 保健 和 生命 科学 领域 中 多 个 已 有 的 大 型 本 体 的 
表达 能 力 (例如 SNOMED-CT、Gene 本 体 和 GALEN),。9 

OWL2 EL 的 主要 优势 是 处 理 合 取 和 存在 限制 。 它 是 轻 量 级 的 语言 ， 并 且 以 多 项 式 时 间 支 
持 可 靠 且 完备 的 推理 。 和 OWL2 DL 最 主要 的 区 别 是 它 取消 了 owl :Al1lValuesFrom 限制 ， 
然而 它 还 是 支持 属性 上 的 rdfs :range 限制 ， 这 能 取得 相似 的 效果 。 

OWL2 QL 为 OWL2 DL 和 OWL2 EL 开发 的 推理 机 为 类 公理 的 推理 而 优化 ， 当 处 理 
拥有 相对 不 复杂 的 类 定义 但 是 包含 大 量 个体 断 言 的 本 体 时 则 相对 低 效 。OWL2 的 QL 概要 被 
开发 用 于 高 效 地 处 理 对 这 些 本 体 的 查询 应 答 ， 并 采用 了 源 自 关系 数据 库 管 理 的 技术 。 它 基于 
DL-Lite 描述 逻辑 并 扩展 了 更 具 表 达能 力 的 特性 ， 例 如 属性 包含 公理 ( owl:subPropertyOf) 和 
函数 型 / 反 孔 数 型 对 象 属性 。 

OWL2 RL OWL2 RL 概要 基于 称 为 描述 逻辑 编程 (Description Logic Programming) 的 
语言 ， 并 使 得 描述 逻辑 和 规则 能 够 交互 : 它 是 使 用 规则 能 够 实现 的 OWL2 DL 的 最 大 语法 部 
分 。 这 是 一 个 非常 重要 的 特性 ， 因 为 规则 可 以 高 效 地 并 行 执行 ， 允 许 实现 大 规模 推理 。 

OWL2 RL 区 别 于 QL 和 EL 概要 的 地 方 在 于 ， 它 提供 了 DL 视角 和 OWL Full 视角 之 间 的 
桥梁 : 规则 推理 机 能 够 很 容易 地 丢弃 OWL DL 的 限制 (例如 类 和 个 体 之 间 的 区 别 )。 这 意味 着 ， 
OWL2 RL 的 规则 实现 可 以 实现 OWL Full 的 子 集 。 面 向 语义 网 语言 的 大 多 数 可 伸缩 的 推理 机 
中 的 大 部 分 实现 了 OWL2 RL 或 者 一 个 相似 的 称 为 pD* 或 OWL-Horst 的 语言 。 必 须 被 实现 的 
规则 集合 作为 OWL2 RL 规范 的 一 部 分 发 布 。 





4.6 ”小结 


OWL2 扩展 了 RDF Al RDF 模式 ， 引 入 了 一 组 表达 能 力 更 强 的 语言 特征 ， 例 如 基数 约 
R, KWEN, ZEME. 

通过 OWL 与 逻辑 之 间 的 对 应 关系 提供 了 形式 语义 和 推理 支持 。 

OWL2 分 为 两 类 。OWL2 DL 在 OWL2 和 RDFS 语言 元 素 的 组 合 上 施加 某 些 限制 来 保 
留 可 判定 性 。OWL2 Full 则 是 RDF 模式 的 完全 兼容 扩展 ， 拥 有 所 有 OWL2 语言 特征 ， 
但 是 它 被 证 明 是 不 可 判定 的 。 

3 个 概要 ，OWL2 EL, OWL2 QL 和 OWL2 RL， 是 满足 计算 性 质 要 求 的 语法 子 集 。 特 
别 地 ，OWL2 RL 可 以 使 用 基于 规则 的 技术 实现 ， 并 且 已 经 成 为 在 语义 网 上 表示 推理 的 
事实 标准 。 

OWL2 有 4 种 标准 语法 ，RDF/XML、 曼 彻 斯 特 语法 、OWL/XML 和 函数 式 语 法 。 


日 ”参见 http://www.snomed.org, http://www.geneontology.org 和 http:Wwww.openclinical.org/prj_galen.html。 
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建议 阅读 


下 面 是 学 习 更 多 有 关 OWL 语言 的 主要 入 口 点 : 

èe Boris Motik, Bernardo Cuenca Grau, Ian Horrocks, Zhe Wu, Achille Fokoue, and Carsten 
Lutz, eds. OWL 2 Web Ontology Language Profiles. 
www.w3.org/TR/owl2-profiles/. 

e Boris Motik, Peter F. Patel-Schneider, and Bernardo Cuenca Grau, eds. OWL 2 Web 
Ontology Language Direct Semantics. 
www.w3.org/TR/owl2-direct-semantics/. 

e Boris Motik, Peter F. Patel-Schneider, and Bijan Parsia, eds. OWL 2 Structural Specification 

and Functional-Style Syntax. 

www.w3.org/TR/owl2-syntax/. 

Michael Schneider, ed. OWL 2 Web Ontology Language RDF-Based Semantics. 


www.w3.org/TR/owl2-rdf-based-semantics/. 


W3C OWL Working Group, eds. OWL 2 Web Ontology Language Document Overview. 

www.w3.org/TR/owl2-overview/. 

有 关 OWL2 的 基础 教程 和 导 课 包括 : 

e Pascal Hitzler, Markus Krétzsch, Bijan Parsia, Peter F. Patel-Schneider, and Sebastian 
Rudolph. OWL 2 Web Ontology Language Primer. 
www.w3.org/TR/owl2-primer/. 

ə Matthew Horridge. The Manchester Pizza Tutorial. 
owl.cs.manchester.ac.uk/tutorials/protegeowltutorial/. 

有 关 OWL? 的 逻辑 基础 的 重要 文献 有 : 

e Franz Baader, Sebastian Brandt, and Carsten Lutz. Pushing the EL Envelope. Proceedings of 
IJCAI 2005: 364-369. 

e I. Horrocks, O. Kutz, and U. Sattler. The Even More Irresistible SROIQ. InProceedings of 
the 10th International Conference of Knowledge Representation and Reasoning (KR-2006, 
Lake District UK), 2006. 

e Herman J. ter Horst. Combining RDF and Part of OWL with Rules: Semantics, Decidability, 
Complexity. International Semantic Web Conference 2005, 668-684. 

一 个 (非常 不 完整 的 ) 针对 OWL 开发 的 软件 和 推理 机 列表 (在 本 书写 作 时 ): 

。CEL， 一 个 针对 OWL2 EL 概要 优化 的 OWL 推理 机 ， 由 德 累 斯 顿 大 学 开发 。 人 参见 
http://lat.inf.tu-dresden.de/systems/cel/。 

© HermiT， 一 个 面向 复杂 本 体 的 快速 推理 机 ， 由 牛津 大 学 开发 。 参 见 http://www.hermit- 
reasoner.com, 

。 OWLIM, 一 个 OWL2 RL 概要 的 快速 OWL 推理 机 ， 由 Ontotext 开 发。 参见 http:// 


www.ontotext.com/owlim., 
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Pellet， 特 性 最 丰富 的 OWL 推理 机 之 一 ， 由 Clark 和 Parsia 开发 。 参 见 http://pellet. 

owldl.com. 

Protégé, OWL 本 体 的 事实 标准 编辑 环境 ， 由 斯 坦 福 大 学 开发 。 它 拥有 多 个 内 置 推理 

机 。 参 见 http://protege.stanford.edu。 

e TopBraid Composer， 一 个 OWL 本 体 的 基于 RDF 的 编辑 环境 ， 由 TopQuadrant FF 
发 。 它 支持 SPARQL， 连 接 三 元 组 存储 库 ， 以 及 使 用 OWLIM 推理 。 参 见 http://www. 
topquadrant.com/products/TB_Composer.html。 

e WebPIE， 一 个 针对 OWL 的 ter Horse 部 分 (笼统 说 OWL2 RL) 的 大 规模 可 伸缩 的 推理 

引擎 ， 由 阿姆斯特丹 自由 大 学 开发 。 参 见 http://www.few.vu.nl/~jui200/webpie.html。 


练习 和 项 目 


1. 阅读 OWL 的 在 线 规范 。 

2. 用 3 种 不 同 的 方法 声明 两 个 类 不 相交 。 

3. 表达 以 下 事实 : 所 有 数学 课程 只 由 David Billington HR (没有 其 他 讲师 参与 )。 同 时 ， 
表达 以 下 事实 : David Billington 只 讲授 数学 课程 。 这 两 个 事实 的 区 别 清楚 吗 ? 

4. 严格 地 说 ，owl1 :SymmetricProperty 定义 在 OWL 中 并 不 需要 ， 因 为 它 可 以 根据 其 
他 语言 原 语 表达 。 解 释 如 何 实 现 (提示 : 也 考虑 inverse)。 

5. 类 似 的 问题 也 适合 owl:FunctionalProperty 和 owl:NegativeProperty- 
Assertion。 展 示 如 何 使 用 其 他 语言 结构 来 表达 它们 。 

6. 判断 通常 OWL 中 哪些 特征 是 必须 的 ， 而 哪些 只 是 为 了 方便 但 是 可 以 通过 其 他 建 模 原 
语 来 模拟 。 

7. 解释 FunctionalProperty, InverseFunctionalProperty #l InverseOf = 
个 概念 之 间 的 联系 。 

8. 解释 为 什么 需要 声明 owl:Class 是 rdfs :Class 的 一 个 子 类 。 

9. 在 2.7 节 ， 我 们 介绍 了 RDF 的 一 个 公理 化 语义 。 也 可 以 为 OWL 开发 一 个 相似 的 公理 
化 语义 。 定 义 owl:intersectionof 的 公理 化 语义 。 

10. 定义 owl: inverseOf 的 公理 化 语义 。 

11. 在 这 个 练习 中 ， 请 你 开发 基数 限制 的 一 个 公理 化 语义 : 

(a) 定义 noRepeatsList。 荆 是 一 个 “无 重复 的 列表 ”， 仅 当 工 中 不 存在 一 个 元 素 出 现 
超过 一 次 。 这 个 概念 不 是 OWL 语言 的 一 部 分 ， 但 是 它 将 被 用 于 计数 基数 限制 中 的 元 素 个 数 。 

(b) 定义 owl:minCardinality 和 owl:maxCardinality 为 定义 域 是 owl:Restriction 
而 值 域 是 :NonNegativeInteger 的 属性 。 

(c) 给 出 描述 mincardinality 含义 的 公理 : 

如 果 有 onProperty(R, P) 和 minCardinality(R, n)， 那 么 x Æ R 的 一 个 实例 ， 当 且 仅 当 存 在 
一 个 “无 重复 的 列表 ”LL， 其 长 度 三 n， 满 足 对 于 所 有 y ELA PCy). | 

(d) 以 相似 的 方式 表达 owl :maxCardinality 的 含义 。 
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12. 观察 hg co-ode.org/ontologies/ 中 的 一 些 本 体 。 

13. 使 用 OWL2 写 一 个 你 自己 的 本 体 。 

14. OWL2 是 OWL 语言 的 最 新 版 本 。 阅 读 之 前 版 本 的 网 页 (参见 http://www.w3.org/2004/ 
OWL/) 以 及 一 些 示 例 本 体 。 比 较 旧 的 OWL 语言 和 OWL2， 特 别 注意 它们 的 共同 点 和 区 别 
之 处 。 

15. 比较 OWL2 和 第 1 版 OWL 的 相关 在 线 文档 。 


第 5 章 


A Semantic Web Primer, Third Edition 


逻辑 与 推理 : 规则 





5.1.1 逻辑 与 规则 


从 一 个 抽象 的 角度 来 说 ， 第 2 章 和 第 4 章 的 主题 都 与 知识 的 表示 (representation of 
knowledge) 相关 : 关于 万 维 网 资源 内 容 的 知识 ， 关 于 一 个 论 域 中 的 概念 及 其 相互 联系 (本体 ) 
的 知识 。 

早 在 万 维 网 出 现 之 前 ， 知 识 表示 就 已 经 在 人 工 智 能 领域 和 更 早 的 哲学 领域 中 被 研究 了 很 
长 时 间 。 事 实 上 ， 可 以 追溯 到 古 希 腊 。 亚 里 士 多 德 被 认为 是 逻辑 之 父 。 逻 辑 仍然 是 知识 表示 
的 基石 ， 特 别 是 谓词 逻辑 ( predicate logic), EKA —Mri¥ 4# (first-order logic)。 下 面 是 逻辑 
之 所 以 流行 和 重要 的 原因 : 

。 它 提供 了 一 种 高 级 语言 ， 以 一 种 透明 的 方式 来 描述 知识 。 并 且 ， 它 有 很 强 的 描述 能 力 。 

© 它 有 一 种 很 好 理解 的 形式 语义 ,将 无 歧义 的 含义 赋予 逻辑 语句 。 

对 人 逻辑 结论 有 精确 的 定义 ， 以 确定 一 个 语句 在 语义 上 是 否 可 以 从 男 一 组 语句 (前提 ) 
推出 。 事 实 上 ， 有 逻辑 的 首要 原始 动机 就 是 研究 逻辑 结论 的 客观 规律 。 

已 经 有 了 一 些 证 明 系 统 ， 可 以 在 语法 上 自动 地 从 一 组 前 提 推 导出 语句 。 

已 经 有 了 一 些 证 明 系统 ， 在 其 内 部 ， 语义 逻辑 推理 和 语法 推导 是 一 致 的 。 证 明 系 统 应 
当 是 正确 的 (所 有 推导 的 语句 都 能 在 语义 上 从 前 提 推 出 ) 和 完备 的 〈 前 提 的 所 有 逻辑 结 
论 都 能 在 证 明 系 统 中 推导 )。 

谓词 逻辑 很 特殊 ， 因 为 正确 和 完备 的 证 明 系 统 是 存在 的 。 描 述 能 力 更 强 的 逻辑 (高 阶 
逻辑 ) 没有 这 样 的 证 明 系 统 。 

由 于 证 明 系 统 的 存在 ， 有 可 能 跟踪 通 向 逻辑 结论 的 证 明 过 程 。 在 这 个 意义 上 ， 逻辑 可 
以 提供 答案 的 解释 。 

RDF 和 OWL2 语言 (除了 OWL2 Full) 可 以 视 作 谓词 逻辑 的 专门 化 。 

这 种 专门 化 的 语言 存在 的 一 个 缘由 是 它们 提供 了 适合 于 特殊 用 途 (在 我 们 的 场景 中 ， 即 
基于 标签 的 万 维 网 语言 ) 的 语法 。 另 一 个 主要 缘由 是 它们 定义 了 合理 的 逻辑 子 集 。 如 前 所 述 ， 
在 逻辑 的 描述 能 力 和 计算 复杂 性 之 间 有 一 个 权衡 问题 : 语言 的 描述 能 力 越 强 ， 相 应 的 证 明 系 
统 就 越 低 效 。 我 们 已 经 提 到 过 ， 大 多 数 OWL 的 变种 对 应 于 一 个 描述 逻辑 ， 是 谓词 逻辑 的 一 
个 存在 高 效 证 明 系 统 的 子 集 。 
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谓词 逻辑 的 另 一 个 存在 高 效 证 明 系 统 的 子 集 由 规则 系统 (rule system) 组 成 ， 也 叫做 Horn 
逻辑 (Horn logic) 或 有 定 逻 辑 程序 (definite logic program)。 规 则 的 形式 如 下 : 


41,...4, > B 


其 中 ，4; AB 是 原子 公式 。 事 实 上 ， 有 两 种 直观 理解 这 条 规则 的 方式 : 

1) 如 果 已 知 41…, 4 为 真 ， 那么 8 也 为 真 。 以 这 种 方式 解释 的 规则 称 为 演绎 式 规 则 
(deductive rule) 9, 

2) WRAY A, A, 为 真 ， 那 么 执行 动作 B。 以 这 种 方式 解释 的 规则 称 为 反应 式 规则 
(reactive rule), 

两 种 视角 都 有 重要 应 用 。 然 而 ， 在 本 章 中 ， 我 们 采用 演绎 式 方法 。 我 们 研究 的 是 语言 、 
可 以 问 的 可 能 查询 以 及 合适 的 答案 。 此 外 ， 我 们 概述 能 返回 这 些 答案 的 一 套 证 明 机 制 的 运作 。 

ARMA, FHI IR A Horn 逻辑 在 某 种 意义 上 是 正 交 的 ， 即 它们 都 不 是 对 方 的 子 集 。 例 
如 ， 在 描述 逻辑 中 ， 不 可 能 定义 出 一 个 表示 快乐 配偶 的 类 ， 即 那些 与 自己 最 好 朋友 结婚 的 人 。 
但 这 一 知识 可 以 容易 地 使 用 规则 来 表示 : 


married( X,Y), bestFriend(X,Y) 一 happySpouse(X) 


男 一 方面 ， 规则 (通常 ) 不 能 断言 : (a) 类 的 否定 / 补 集 ; Cb) 析 取 /并 集 的 信息 (例如 ， 
一 个 人 或 者 是 男人 或 者 是 女人 ) ;(c) 存在 量词 (例如 ,所 有 人 都 有 父亲 )。 相 反 ，OWL 能 够 
描述 类 的 补 集 和 并 集 ， 以 及 某 些 形式 的 存在 量词 。 

接 下 来 ,我 们 将 注意 力 转移 到 另 一 种 规则 。 给 出 一 个 简单 的 例子 。 假 设 一 个 在 线 供 应 商 
想 在 顾客 生日 当天 提供 一 个 特殊 折扣 。 一 种 简单 的 使 用 规则 来 表示 这 一 业务 策略 的 方式 如 下 : 

Ri: 如 果 是 生日 ， 则 有 特殊 折扣 。 

R2: 如 果 不 是 生日 ， 则 没有 特殊 折扣 。 

当 生 日 已 知 时 ， 这 一 解决 方案 可 以 正常 工作 。 但 想象 一 下 ， 一 个 顾客 出 于 隐私 考虑 拒绝 
提供 他 的 生日 。 在 这 种 情况 下 ， 之 前 的 规则 就 没 法 运用 了 ， 因 为 它们 的 前 提 未 知 。 为 了 应 对 
这 种 情况 ， 我 们 需要 这 样 写 : 

Ri: 如 果 是 生日 ， 则 有 特殊 折扣 。 

R2 : 如 果 生 日 未 知 ， 则 没有 特殊 折扣 。 

然而 ， 规 则 R2 的 前 提 超 出 了 谓词 逻辑 的 描述 能 力 。 因 此 ， 我 们 需要 一 种 新 型 的 规则 系 
统 。 我 们 注意 到 ， 基 于 规则 RL 和 R 的 解决 方案 在 我 们 拥有 完整 信息 时 (例如 ， 或 者 是 生日 或 
者 不 是 生日 ) 是 可 以 工作 的 。 这 种 新 型 的 规则 系统 将 在 可 获得 的 信息 不 完整 时 找到 应 用 场景 。 

谓词 逻辑 及 其 特例 是 单调 的 ( monotonic)， 其 含义 如 下 。 只 要 能 得 出 一 个 结论 ， 即 便 加 入 
了 新 的 知识 ， 它 仍然 有 效 。 但 如 果 规 则 R 用 来 推导 “没有 特殊 折扣 ”这 一 结论 ， 那 么 之 后 
当 顾 客 的 生日 变 为 未 知 且 恰 与 购买 日 期 相同 时 ， 这 一 结论 可 能 就 变 为 无 效 了 。 这 一 行为 称 为 
非 单调 ( nonmonotonic)， 因 为 新 信息 的 加 入 导致 了 结论 的 丢失 。 因 此 ， 我 们 对 非 单调 规则 和 


O 原则 上 讲 ， 有 两 种 方式 运用 演绎 规则 : ME (41…, A) 到 结论 (B) (前 向 链 ，forward chaining)， 以 及 从 结 
W% (目标 ) 到 体 (6 et, backward chaining ) 。 
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单调 规则 〈 是 谓词 逻辑 的 一 种 特例 ) 加 以 区 分 。 在 本 章 中 ,我 们 同时 讨论 单调 和 非 单调 规则 。 


5.1.2 ”语义 网 上 的 规则 
规则 技术 已 经 存在 几 十 年 了 ,已 被 广泛 应 用 于 实践 中 ， 并 且 已 经 较为 成 熟 。 这 样 的 部 
署 已 经 催生 了 各 种 各 样 的 方法 。 结 果 是 ,在 (语义 ) 网 的 情境 中 标准 化 这 一 领域 越发 困难 。 
W3C 的 一 个 工作 组 已 经 开发 出 了 规则 交换 格式 (Rule Interchange Format，RIF) 标准 。 了 解 
‘EAI RDF 与 OWL 的 区 别 是 很 重要 的 : 后 两 者 作为 直接 表达 知识 的 语言 ， 而 RIF 被 设计 为 主 
要 用 来 在 不 同 应 用 之 间 交 换 规 则 。 例 如 ， 一 家 在 线 商店 可 能 希望 一 些 智能 系统 可 以 存 取 它 以 
规则 描述 的 定价 、 退 款 和 隐私 策略 。 语 义 网 方法 是 用 一 种 我 们 已 经 讨论 过 的 万 维 网 语言 来 以 
一 种 机 器 可 存 取 的 方式 描述 知识 。 
鉴于 潜在 目标 是 提供 服务 于 不 同 规则 系统 之 间 的 交换 格式 ，RIF 组 合 了 很 多 特征 ， 所 以 
相当 复杂 。 因 此 有 一 些 质疑 其 是 否 真 的 会 作为 描述 知识 的 主要 语言 被 广泛 使 用 。 事 实 上 ， 那 
些 希 望 为 语义 网 开发 规则 系统 的 人 们 有 各 种 选择 : 
e RDF 上 的 规则 可 以 使 用 SPARQL 构件 来 优雅 地 描述 ; 在 这 个 方向 上 ， 一 项 近期 的 提案 
是 SPIN 9, 
。 如果 希望 在 遇 到 丰富 语义 结构 时 使 用 规则 ， 可 以 使 用 SWRL， 它 结合 了 OWL DL 的 功 
能 和 某 些 规则 。 
。 如 果 希 望 用 OWL 来 建 模 ， 但 又 想 使 用 规则 技术 来 实现 ， 可 以 使 用 OWL2 RL, 
方法 上 的 多 元 性 正 是 本 章 看 起 来 和 之 前 几 章 非 常 不 同 的 原因 ， 之 前 几 章 是 基于 一 个 或 一 
复 非 常 稳定 并 广泛 使 用 的 标准 。RIF 正 朝 着 这 个 方向 发 展 , 但 尚未 同等 地 得 到 社区 的 一 致 认 
可 和 采纳 。 因 此 ， 本 章 在 一 个 宽泛 的 层面 陈述 观点 ， 并 陈述 一 些 具体 方法 。 


建议 那些 对 谓词 逻辑 的 记号 和 基本 概念 感到 不 适 的 读者 ， 去 读 一 些 罗 辑 书籍 的 导论 章节 ， 
例如 本 章 最 后 罗列 的 那些 。 或 者 ， 可 以 跳 过 5.3 节 和 5.4 节 的 一 些 部 分 。 

。 5.2 节 提 供 了 一 个 使 用 单调 规则 (BUPA Horn 逻辑 的 谓词 逻辑 的 子 集 ) 的 例子 。 

© 5.3 节 和 5.4 节 描 述 了 Horn 逻辑 的 语法 和 语义 。 

。 5.5 节 讨 论 了 OWL2 RL 和 规则 之 间 的 联系 。 

© 5.6 节 陈 述 了 RIF 方言 徐 ， 并 特别 关注 基于 逻辑 的 语言 。 

。5.7 WHET SWRL， 其 作为 一 种 结合 规则 和 描述 逻辑 的 方式 。 

。 5.8 节 简 要 描述 了 怎样 使 用 SPARQL 构造 子 来 建 模 规 则 。 

。 5.9 节 描 述 了 非 单 调 规 则 的 语法 ，5.10 节 陈 述 了 非 单调 规则 的 一 个 例子 。 

e 5.11 节 简 要 描述 了 RuleML， 它 是 一 项 正在 进行 的 为 了 在 万 维 网 上 标记 规则 的 活动 ， 

它 有 一 个 开放 的 和 实验 性 的 日 程 表 ， 可 能 会 在 未 来 形成 新 的 标准 。 


© 然而，SPARQL 并 不 是 一 种 规则 语言 ， 因 为 它 本 质 上 执行 的 是 规则 的 一 个 应 用 。 规 则 系统 必须 建立 在 例如 
SPIN 的 上 层 。 
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5.2 单调 规则 的 例子 : 家 庭 关 系 

想象 一 个 数据 库 包 含 关于 一 些 家 庭 关系 的 事实 。 假 设 数据 库 包 含 关于 如 下 基础 谓词 (base 
predicate) 的 事实 : 

mother(X,Y) XX 是 了 的 母亲 

father(X,Y) XX 是 了 的 父亲 

male(X) XEBY 

female(X) XEN 
接 下 来 ， 我 们 可 以 使 用 合适 的 规则 来 推出 更 多 的 联系 。 首 先 ， 我 们 可 以 定义 一 个 parent 谓词 : 
一 位 parent 或 者 是 一 位 父亲 或 者 是 一 位 母亲 。 

mother(X,Y) 一 parent(X,Y) 

father(X,Y) > parent(X,Y) 


接 下 来 ， 我 们 可 以 将 拥有 共同 父亲 (或 母亲 ) 的 男人 定义 为 兄弟 : 
male( X), parent(P, X), parent(P, Y), notSame(X,Y) 一 


brother(X,Y) 


notSame 谓词 指 不 相同 ; 我 们 候 设 这 些 事实 被 保存 在 一 个 数据 库 中 。 当 然 ， 每 个 实际 的 逻辑 系 
统 都 提供 了 方便 地 描述 相同 和 不 相同 的 方式 ， 但 我 们 选择 这 个 抽象 的 解决 方案 以 使 得 讨论 更 
具 一 般 性 。 

类 似 地 ，sister 如 下 定义 : 

female(X), parent(P, X), parent(P, Y), notSame(X,Y) 一 

sister(X,Y) 
叔叔 是 父母 亲 的 兄弟 : 

brother(X, P), parent(P, Y) > uncle(X,Y) 
祖母 是 父母 亲 的 妈妈 : 

mother(X, P), parent(P, Y) — grandmother(X,Y) 
祖先 或 者 是 父母 亲 ， 或 者 是 父母 亲 的 祖先 : 


parent(X, Y) — ancestor(X,Y) 


ancestor(X, P), parent(P,Y ) — ancestor(X,Y ) 


5.3 ”单调 规则 : 语法 
我 们 来 考虑 一 条 简单 的 规则 ， 说 明 所 有 超过 60 岁 的 忠实 顾客 都 有 权 享受 一 项 特殊 折扣 : 
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loyalCustomer(X), age(X) > 60 一 discount(X) 

我 们 区 分 一 些 规 则 成 分 : 

e 变量 (variable) 是 值 的 占 位 符 : X。 

e 常量 (constant) 指 代 固 定 的 值 : 60。 

。 谓词 (predicate) 将 对 象 关联 起 来 : loyalCustomer, >. 

e 函数 符号 (function symbol) 在 作用 于 特定 参数 时 指称 一 个 值 : ages 

如 果 不 使 用 任何 函数 符号 ， 我 们 讨论 的 就 是 无 函数 (Horn) 逻辑 。 
5.3.1 规则 

规则 的 形式 是 : 

Bi PETREA B, 一 4 
Hp, A, By, B, 是 原子 公式 。4 是 规则 的 头 (head), B+, B, 是 规则 的 前 提 (premise). 
集合 {83,…, B,} 称 为 规则 的 体 (body). 

规则 体 中 的 逗号 理解 为 合 取 : 如 果 B, and B, and … and B, 为 真 ， 那 么 4 也 为 真 (或 者 等 
价 地 说 ， 要 证 明 4， 只 要 证 明 所 有 Bpo, B 就 足够 了 )。 

注意 ， 变量 可 能 出 现在 A ` Bes B, 中 。 例如 , 

loyalCustomer(X), age(X) > 60 一 discount(X) 
这 条 规则 用 于 任何 顾客 :如果 一 个 顾客 碰巧 是 忠实 的 并 且 超过 60 岁 ， 那 么 她 就 会 得 到 折扣 。 
换 句 话说 ， 变 量 关 是 隐 式 全 称 量化 的 (使 用 VX)。 一 般 而 言 ， 出 现在 规则 中 的 所 有 变量 都 是 
隐 式 全 称 量化 的 。 

总 之 ,一 条 规则 + 


Bi,...,Bn—» A 
被 解释 为 下 述 公式 ， 记 作 plr): 
VX1...YXk((Bi A... A Bn) > A) 
或 者 等 价 地 ， 
VX,...VX4(A V -BIV...V-Bn) 
HH, Xi, NERABEA, By, B, 中 的 变量 。 


5.3.2 事实 


事实 是 一 个 原子 公式 ， 例 如 loyalCustomer(a345678) 阐述 了 ID 为 2345678 的 顾客 是 忠实 
的 。 一 条 事实 中 的 变量 是 隐 式 全 称 量 化 的 。 
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5.3.3 ”逻辑 程序 
逻辑 程序 P 是 一 个 由 事实 和 规则 组 成 的 有 限 集合 。 它 的 谓词 逻辑 转换 pl(P) 是 已 中 所 有 
规则 和 事实 的 谓词 逻辑 解释 的 集合 。 
5.3.4 Bir 
目标 指 的 是 向 一 段 逻 辑 程序 提出 的 一 个 查询 G。 它 的 形式 是 
Bi,..., Bn, > 
如 果 n=0， 就 称 为 空 目标 (empty goal). 


我 们 的 下 一 个 任务 是 在 谓词 逻辑 中 解释 目标 。 借 助 我 们 目前 已 经 知道 的 手法 〈 将 逗号 解 
释 为 合 取 、 隐 式 全 称 量化 )， 我 们 得 到 如 下 解释 : 


VX,...VX,(4B, V...V Ba) 

这 个 公式 与 plr) 几乎 相同 ， 唯 一 的 不 同 之 处 是 规则 头 4 被 省 略 了 s 。 
谓词 逻辑 中 的 一 种 等 价 表示 是 
-3X1 ...3Xk(B1 A...A Bn) 


Bip, Xe, 各 是 出 现在 By, B, 中 的 所 有 变量 。 我 们 来 简要 解释 这 个 公式 。 假 设 我 们 
知道 


p(a) 
并 且 ， 我们 的 目标 是 
p(x) 一 


事实 上 ， 我 们 想 要 知道 是 否 存在 一 个 让 p 为 真 的 值 。 我 们 预期 会 得 到 一 个 肯定 的 答案 ， 因 为 
ARX pla) KAE, pX 是 存在 量化 的 。 但 接 下 来 ， 为 什么 我 们 将 公式 取 和 否定 了 呢 ? 原因 是 
使 用 了 数学 中 的 一 种 叫做 反 证 法 (proof by contradiction) 的 证 明 技 术 。 这 项 技术 证 明 语句 4 
可 以 从 语句 8 推出 的 方法 是 假设 4 为 假 ， 并 结合 8 推导 出 一 个 矛盾 。 那 么 ，4 就 必然 可 以 从 
语句 B 推出。 

在 逻辑 编程 中 ， 我 们 要 证 明 一 个 目标 可 以 被 肯定 回答 的 方式 是 ， 否 定 这 个 目标 ， 再 证 明 


.可 以 通过 使 用 逻辑 程序 得 到 一 个 矛盾 。 例 如 ， 给 定 逻 辑 程序 


p(a) 
和 目标 
AX p(X) 


我 们 得 到 一 个 逻辑 矛盾 : 第 二 个 公式 说 没有 元 素 拥有 属性 p， 但 第 一 个 公式 说 值 a 拥有 属性 p。 


日 ”注意 这 个 公式 等 价 于 VX, +X, false V AB, VeV -nm8)， 因 此 ， 失 去 的 规则 头 可 以 被 认为 是 矛盾 假 。 


iF HR 45 BEL HA 83 





FAK, AXp(X) 可 以 从 p(a) 推出 。 
5.4 单调 规则 : 语义 


5.4.1 谓词 逻辑 语义 


一 种 回答 查询 的 方式 是 使 用 规则 、 事 实 和 查询 的 谓词 逻辑 解释 ， 并 利用 众所周知 的 谓词 
逻辑 的 语义 。 具 体 而 言 ， 给 定 一 段 逻 辑 程 序 P 和 一 个 查询 


Bi,..., Bn > 


及 其 包含 的 变量 X, 么 ， 我 们 对 这 个 查询 的 回答 是 肯定 的 ， 当 且 仅 当 


pl(P) j= 3X1...3X4(B, A... Bn) (1) 
或 者 等 价 地 ， 当 
pl(P) U {73X1 . .. 3Xk(B1 A... A Bn)} (2) 


不 可 满足 时 。 换 句 话 说， 当 程 序 己 的 谓词 逻辑 解释 和 查询 的 谓词 逻辑 解释 不 可 满足 ( 存 
在 矛盾 ) 时 ， 我 们 给 出 一 个 肯定 的 答案 。 

谓词 逻辑 的 语义 概念 的 形式 化 定义 在 文献 中 可 以 找到 。 这 里 我 们 仅 给 出 一 个 非 形式 化 的 
Mok, WIAA (签名 ) 的 组 件 可 能 具有 任何 我 们 希望 的 含义 。 每 个 谓词 逻辑 模型 4 都 赋予 
一 种 特定 的 含义 。 特 别 地 ， 它 的 组 成 包括 

e 一 个 域 (domain) dom(4)， 是 一 个 非 空 的 对 象 集合 ， 公 式 构成 了 关于 它们 的 语句 。 

。 对 应 域 中 每 个 常量 的 元 素 。 

。 对 应 每 个 函数 符号 的 dom(4) 上 的 具体 函数 。 

。 对 应 每 个 谓词 的 dom(4) 上 的 具体 关系 。 

当 = 符 号 用 来 指示 相等 时 ( 即 它 的 解释 是 固定 的 )， 我 们 讨论 的 就 是 带 等 式 的 Horn 逻辑 
(Horn logic with equality), EEIZ n, V. A. S V .了 根据 它们 的 直观 含义 定义 为 : 非 、 
或 、 与 、 蕴 涵 、 任 取 、 存 在 。 这 样 我 们 定义 ， 当 一 个 公式 在 模型 4 中 为 真 时 ， 记 作 4 Kg. 

公式 9 可 以 从 公式 集合 M 中 推出 ， 当 9 在 所 有 M 为 真 的 模型 4 中 都 为 真 时 ( 即 M 中 的 
所 有 公式 在 4 中 都 为 真 )。 

现在 ， 我 们 能 够 解释 (1) 和 (2) 了 。 无 论 我 们 怎样 解释 尸 中 出 现 的 和 常量、 谓词 和 函数 
符号 以 及 查询 ， 只 要 的 谓词 逻辑 解释 为 真 ， 3X…3X (B Ae A B) 也 一 定 为 真 ， 即 变量 
Xo, X AERA RT AR B 都 为 真 。 

例如 ， 假 设 己 是 逻辑 程序 


p(a) 
p(X) > gq(X) 


考虑 查询 
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q(x) > 


显然 , qla) 可 以 从 pl(P) 推出 。 因 此 ,3Xg(X) 可 以 从 pl(P) 推 出 ， 所 以 pP) U {A5Xq(X)} 
是 不 可 满足 的 ， 于 是 我 们 给 出 一 个 肯定 的 答案 。 但 如 果 考 虑 查询 


q(b) 一 
那么 必须 给 出 一 个 否定 的 答案 ， 因 为 gb) 不 能 从 pP) 推出 。 
5.4.2 ”最 小 Herbrand 模型 语义 


另 一 种 导 辑 程序 的 语义 一 一 最 小 Herbrand 模型 语义 ,要 求 更 多 的 技术 讨论 ， 可 以 在 标准 
的 逻辑 教科 书 (参见 建议 阅读 ) 中 找到 描述 。 


5.4.3” 闭 证 据 和 参数 化 证 据 

到 目前 为 止 ， 我 们 已 经 关注 了 查询 的 是 /和 否 答 案 。 然 而 ， 这 种 查询 未 必 是 最 优 的 。 假 设 
我 们 有 如 下 事实 

p(a) 

以 及 查询 

p(x) 一 


肯定 的 答案 是 正确 的 但 并 不 令 人 满意 。 它 很 像 一 个 笑话 中 提 到 的 ， 你 被 问 到 “你 知道 现在 几 
点 吗 ?”， 你 看 了 看 你 的 手表 回答 “是 的 ” 。 在 我 们 的 例子 中 ,合适 的 答案 是 一 个 替代 


{X/a} 


其 给 出 了 XX 的 一 个 实例 化 ， 并 同时 给 出 了 肯定 的 答案 。 常 量 a 叫做 闭 证 据 ( ground witness). 
给 定 以 下 事实 


p(a) 
p(b) 

对 同样 的 查询 有 两 个 闭 证 据 : a PA RESTE, RIMAR RNR 
{X/a} 
{X/b} 

尽管 是 有 价值 的 ， 闭 证 据 却 并 不 总 是 最 优 答案 。 考 虑 逻辑 程序 
add(X,0, X) 
add(X,Y,Z) > add(X, s(Y), s(Z)) 


如 果 我 们 将 s 理解 为 “后 继 函 数 "， 其 返回 值 是 其 参数 值 加 1， 那 么 这 个 程序 做 的 是 加 法 计算 。 
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add 的 第 三 个 参数 计算 前 两 个 参数 的 和 。 考 虑 查询 
add(X, ss(0), 2) = 
可 能 的 闭 证 据 根 据 以 下 替代 来 确定 
{X/0, Z/s*(0)} 
{X/s(0), Z/s°(0)} 
{X/s(s(0)), Z/s'°(0)} 


然而 ， 参 数 化 证 据 (parameterized witness) Z=s°(X) 是 见证 以 下 存在 查询 的 最 概括 的 方式 
JX3Z add(X, ss(0), Z) 


因为 它 表 示 的 事实 是 ， 只 要 Z 的 值 等 于 XX 的 值 加 8，add(X, s*(0), Z) 就 为 真 。 
最 具 概 括 性 的 证 据 的 计算 是 一 个 叫做 SLD 归结 的 证 明 系 统 的 首要 目标 ， 其 陈述 超出 了 本 
书 的 范围 。 


5.5 OWL2 RL: 当 描 述 逻 辑 遇 见 规则 
如 本 章 开始 时 所 述 ，Horn 逻辑 和 描述 逻辑 是 正 交 的 。 当 尝试 将 它们 集成 进 一 个 框架 中 时 ， 
最 简单 的 方法 是 考虑 两 个 逻辑 的 交集 ， 即 一 种 语言 中 可 以 用 一 种 保持 语义 的 方式 转换 到 另 一 
种 语言 的 那个 部 分 ， 且 反 过 来 也 成 立 。 本 质 上 ，OWL2 RL 旨 在 捕获 OWL 的 这 个 片段 。 这 种 
方法 的 优势 包括 : 
。 从 建 模 者 的 角度 来 说 ， 可 以 为 了 建 模 的 目的 ， 根 据 建 模 者 的 经 验 和 偏好 ， 来 自由 地 使 
用 OWL 或 者 规则 (以 及 相关 的 工具 和 方法 )。 
。 从 实现 的 角度 来 说 ， 描 述 逻 辑 推理 机 和 演绎 规则 系统 都 可 以 使 用 。 因 此 ， 有 可 能 使 用 
一 个 框架 来 建 模 ， 比 如 OWL， 然 后 使 用 另 一 个 框架 的 推理 机 ， 比 如 规则 。 这 一 特性 凭 
昔 种 种 工具 提供 了 额外 的 灵活 性 并 保证 了 互 操作 性 。 
在 本 节 的 剩余 部 分 中 ,我们 展现 许多 RDF 模式 和 OWL2 RL 的 构件 是 如 何 使 用 Horn i 
辑 来 描述 的 ， 并 讨论 一 些 通常 不 能 描述 的 构件 。 这 一 讨论 关注 的 是 那些 能 凸显 规则 和 描述 逻 
辑 之 间 联 系 与 区 别 的 构件 。 想 要 了 解 更 多 的 关于 OWL RL 构件 及 其 与 逻辑 的 关系 的 信息 ， 
请 查阅 5.6.4 节 以 及 本 章 最 后 的 建议 阅读 。 
我 们 以 RDF 和 RDF 模式 开头 。 一 个 形 如 (a, P, b) 的 RDF 三 元 组 可 以 描述 为 一 个 事实 


P(a,b) 
类 似 地 ， 一 个 形 如 type(a,C) 的 实例 声明 一 一 阐述 了 a 是 类 C 的 实例 ， 可 以 描述 为 
C(a) 
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C 是 DD 的 子 类 这 一 事实 可 以 容易 地 描述 为 
C(X) + D(X) 


对 于 子 属性 也 是 类 似 的 。 最 后 ， 定 义 域 和 值 域 约 束 也 可 以 用 Horn 逻辑 描述 。 例 如 ， 以 下 规则 
EET C 是 属性 P 的 定义 域 : 


P(X,Y) > C(X) 
现在 我 们 来 看 OWL, equivalentClass(C, D) 可 以 用 一 对 规则 来 描述 
C(X) > D(X) 
D(X) > C(X) 
对 equivalentProperty 也 是 类 似 的 。 一 个 属性 己 的 传递 性 可 以 容易 地 描述 为 
P(X,Y), P(Y, Z) > P(X, 2) 
现在 我 们 来 看 布尔 运算 。 我 们 可 以 如 下 阐述 类 C 和 C, 的 交集 是 D 的 子 类 : 
Cı(X), C2(X) > D(X) 
从 另 一 个 方向 ， 我 们 可 以 前 述 C 是 D, A D, 的 交集 的 子 类 : 
C(X) > Di(X) 
C(X) > D2(X) 
对 于 并 集 , 我 们 可 以 用 以 下 这 对 规则 来 描述 Cl 和 C 的 并 集 是 D 的 子 类 : 
C1(X) > D(X) 
C2(X) > D(X) 
然而 ， 其 反方 向 超出 了 Horn 逻辑 的 描述 能 力 。 为 了 描述 C 是 D, 和 D, 的 并 集 的 子 类 这 一 事 
实 ， 需 要 在 相应 的 规则 头 中 出 现 析 取 ， 在 Horn 逻辑 中 这 是 不 允许 的 。 注 意 ， 有 一 些 情况 下 转 
HEMT AEN. PMN, 4D, 是 D, 的 子 类 时 ， 那 么 规则 CO 一 DX) 足以 描述 C 是 D AD, k 


并 集 的 子 类 。 但 问题 在 于 没有 一 种 适合 于 所 有 情况 的 转换 方式 。 
最 后 ， 我 们 简要 讨论 OWL 中 的 一 些 约束 形式 。OWL 语句 


:C rdfs:subClassOf [ rdf:type owl:Restriction ; 
owl:onProperty :P ; 


owl:allValuesFrom :D ] . 
可 以 用 Horn 逻辑 如 下 描述 : 
C(X), P(X,Y) — D(Y) 
然而 ， 其 反方 向 一 般 而 言 没 法 描述 。 此 外 ，OWL 语句 
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[ rdf:type owl:Restriction ; 
owl:onProperty Pi 


ow:lsomeValuesFrom :D ] rdfs:subClassOf :C . 


可 以 用 Horn 逻辑 如 下 描述 : 
P(X,Y), DY) > C(X) 


其 反方 向 一 般 而 言 无 法 描述 。 
并 且 ， 基 数 约束 和 类 的 补 集 一 般 而 言 也 不 能 用 Horn 逻辑 描述 。 


5.6 ”规则 交换 格式 : RIF 


5.6.1 概述 


规则 技术 至 今 已 经 存在 几 十 年 了 ， 并 日 趋 多 样 化 〈 例 如 ， 动 作 规则 、 一 阶 规则 、 逻 辑 编 
程 )。 因 此 ，W3C 规则 交换 格式 工作 组 的 目标 并 非 去 开发 一 个 新 的 能 适合 各 种 目的 的 规则 语 
言 ， 而 是 致力 于 万 维 网 上 多 样 的 (已 有 的 或 未 来 的 ) 规则 系统 之 间 的 交换 。 采 用 的 方法 是 开发 
一 簇 语言 ， 称 为 方言 (dialect)。RIF 定义 了 两 种 方言 : 

1) 基于 逻辑 的 方言 (logic-based dialect)。 这 些 用 来 覆盖 那些 基于 某 种 逻辑 的 规则 语言 ， 
例如 ， 一 阶 逻辑 和 各 种 有 着 对 和 否定 的 不 同 解释 的 逻辑 编程 方法 (回答 集 编程 、 良 基 语 义 等 )。 
这 条 分 支 上 目前 已 经 开发 出 的 具体 的 方言 是 : 

。 RIF 核心 (Core)， 本 质 上 对 应 于 无 函数 的 Horn 逻辑。 

e RIF RAi¥ 47 = (Basic Logic Dialect，BLD )， 本 质 上 对 应 于 带 等 式 的 Horn 逻辑 。 

2) 带动 作 的 规则 (rule with action)。 这 些 用 来 覆盖 那些 产生 式 系 统 和 反应 式 规 则 。 这 条 
分 支 上 目前 已 经 开发 出 的 具体 的 方言 是 : 产生 式 规则 方言 (Production Rule Dialect, PRD), 
又 称 RIF-PRD。 

RIF 簇 被 设计 为 具有 通用 性 和 可 扩展 性 。 通 用 性 的 实现 是 通过 所 有 的 RIF 方言 的 语法 和 
语义 都 共享 一 些 基 本 原则 。 可 扩展 性 指 的 是 未 来 的 方言 可 以 被 开发 并 添加 到 RIF 簇 中 的 可 能 
性 。 对 于 基于 逻辑 的 方言 ，RIF 工作 组 通过 开发 远 辑 方言 框架 (Framework for Logic Dialect, 
FLD) 来 支持 通用 性 和 可 扩展 性 ， 人 允许 通过 实例 化 方法 的 各 种 参数 来 指定 各 种 规则 语言 。 这 一 
框架 是 一 项 重要 成 果 ， 但 超出 了 本 书 的 范围 。 接 下 来 ， 我 们 将 要 陈述 RIF-BLD 的 基本 思想 。 

在 这 之 前 ， 需 要 说 明 的 是 ，RIF 工作 组 的 大 量 (如 果 不 是 绝 大 部 分 的 话 ) 工作 都 致力 于 
语义 层面 。 当 然 ， 在 语法 层面 (例如 ， 使 用 XML) 通过 使 用 一 个 逻辑 系统 的 各 种 语法 特征 
AI RIF 之 间 的 映射 ， 也 能 做 到 规则 的 交换 。 但 主要 目的 是 以 一 种 语义 保持 的 方式 (semantic 
preserving way) 来 交换 规则 。 


5.6.2 RIF-BLD 


RIF 基本 逮 辑 方言 基本 上 对 应 于 带 等 式 的 Horn 逻辑 并 附加 上 。 
e 数据 类 型 和 一 些 内 置 。 
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。 框架 。 

RIF-BLD 和 其 他 RIF 的 变种 一 样 ， 希 望 支 持 一 个 通用 的 常用 数据 类 型 、 谓 词 和 函数 的 集 
合 。 这 个 集合 包括 数据 类 型 (例如 ， 整 数 、 布 尔 、 字 符 串 、 日 期 )、“ 内 置 ” 谓 词 (例如 ， 数 
值 大 于 、 前 级、 日 期 小 于 ) 和 取 值 为 这 些 数 据 类 型 的 函数 (例如 ， 数 值 减法 、 蔡 换 、 时 间 中 
的 小 时 )。 

举例 来 说 ， 假 设 我 们 希望 描述 一 条 规则 ， 来 陈述 如 果 一 个 演员 在 至 少 5 年 的 跨度 内 拍摄 
了 超过 3 部 的 成 功 电 影 ， 那 么 他 就 是 一 个 电影 明星 。 并 且 ， 一 部 成 功 的 电影 是 指 获 得 了 好 评 
(例如 ,在 10 分 制 评级 中 超过 8 分 ) 或 者 经 济 上 很 成 功 (票房 超过 了 1 亿美 元 )。 这 些 规则 应 
该 在 DBpedia 数据 集 上 执行 。 

这 些 规则 可 以 用 RIF-BLD 描述 如 下 : 


Document( 
Prefix(func <http://www.w3.org/2007 /rif-builtin-function > 
Prefix(pred <http://www.w3.org/2007 /rif-builtin-predicate# > 
Prefix(rdfs <http://www.w3.org/2000/01/rdf-schema#> 
Prefix(imdbrel <http://example.com/imdbrelation# > 
Prefix(dbpedia <http://dbpedia.org/ontology/> 
Prefix(ibdbrel <http://example.com/ibdbrelation# > 

Group( 
Forall ?Actor ?Film ?Year ( 

If And( dbpedia:starring(?Film ?Actor) 


dbpedia:dateOfFilm(?Film ?Year) 
Then dbpedia:starredInYear(?Film ?Actor ?Year) 


) 
Forall ?Actor ( 
If ( Exists ?Film1 ?Film2 ?Film3 ?Yearl ?Year2 ?Year3 
And ( ”dbpedia:starredlnYear(?Film1 ?Actor ?Year1) 
dbpedia:starredlnYear(?Film2 ?Actor ?Year2) 
dbpedia:starredinYear(?Film3 ?Actor ?Year3) 
External ( pred:numeric-greater-than( 
External(func:numeric-subtract ?Yearl ?Year3) 5))) 
dbpedia:successful(?Film1) 
dbpedia:successful(?Film2) 
dbpedia:successful(?Film3) 
External (pred:literal-not-identical(?Film1 ?Film2)) 
External (pred:literal-not-identical(?Film1 ?Film3)) 
External (pred:literal-not-identical(?Film2 ?Film3)) 
) 


Then dbpedia:movieStar(?Actor) 
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) 
Forall ?Film ( 
If Or ( 
External(pred:numeric-greater-than( 
dbpedia:criticalRating(?Film 8)) 
External (pred:numeric-greater-than( 
dbpedia:boxOfficeGross(?Film) 100000000))) 
Then dbpedia:successful(?Film) 


) 


这 个 例子 演示 了 数据 类 型 和 内 置 的 使 用 。 注 意 运 用 内 置 谓 词 时 使 用 的 External1， 以 及 将 一 
些 规 则 放 在 一 起 的 Group. 

RIF 的 语法 非常 简单 ， 尽 管 相当 喝 喇 (当然 ， 也 有 一 种 基于 XML 的 语法 来 支持 规则 系统 
之 间 的 交换 )。 变 量 名 以 问号 开头 。 符 号 =、# 和 失 分 别 用 来 描述 相等 、 类 属 和 子 类 联系 。 

框架 (frame) 的 使 用 在 面向 对 象 语言 和 知识 表示 中 有 很 悠久 的 历史 ， 在 规则 语言 (例如 
F-Logic) 领域 也 很 突出 。 其 基本 思想 是 将 对 象 表示 为 框架 ， 将 它们 的 属性 表示 为 档 (slot). 
例如 ， 我 们 可 能 有 一 个 教授 类 ， 它 的 槽 如 姓名 、 办 公 室 、 电 话 、 院 系 等 。 这 些 信 息 在 RIF- 
BLD 中 的 描述 如 下 : 


oid[slot1 -> valuel ... slotn -> valuen] 


5.6.3 与 RDF 和 OWL 的 兼容 性 


RIF 的 一 个 主要 特征 是 其 与 RDF 和 OWL 标准 兼容 ， 即 可 以 在 RIFE、RDF 和 OWL 文档 
的 一 个 组 合 上 进行 推理 。 因 此 ，RIF 促进 交换 的 不 仅仅 是 规则 ， 也 是 RDF 图 和 OWL 公理 。 

结合 RIF 和 RDF 的 基本 思想 是 使 用 RIF 框架 公式 来 表示 RDF 三 元 组 : 三 元 组 s p o MR 
示 为 s [p->o]。 其 语义 定义 是 该 三 元 组 得 到 满足 ， 当 上 且 仅 当 相应 的 RIF 框架 公式 也 得 到 满 
i. 例如， 如 果 以 下 RDF 三 元 组 


ex:GoneWithTheWind ex:FilmYear ex:1939 
AH, 那么 以 下 这 条 RIF 事实 也 为 真 


ex:GoneWithTheWind[ex:FilmYear -> ex:1939] 


给 定 如 下 的 RIF 规则 (阐述 的 是 1930 ~ 1968 年 间 使 用 的 好 莱 坞 产品 代码 ): 
Group( 
Forall ?Film ( 
If And( ?Film[ex:Year -> ?Year] 
External(pred:dateGreaterThan(?Year 1930)) 
External(pred:dateGreaterThan(1968 ?Year))) 
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Then ?Film[ex:HollywoodProductionCode -> ex:True] 


) 
可 以 得 出 的 结论 是 
ex:GoneWithTheWind[ex:HollywoodProductionCode -> ex:True] 


以 及 相应 的 RDF 三 元 组 。 
类 似 技术 被 用 来 实现 OWL 和 RIF 之 间 的 兼容 性 。 主 要 特征 是 : 
。 OWL 和 RIF 的 语义 是 兼容 的 。 
。 可 以 从 OWL 公理 和 RIF 知识 的 某 些 结合 来 推出 结论 。 
。 OWL2 RL 可 以 用 RIF 实现 (参见 下 一 节 )。 


5.6.4 用 RIF 描述 OWL2 RL 


一 个 一 阶 规则 的 集合 部 分 地 描述 OWL2 RL， 它 们 为 使 用 规则 技术 的 一 个 实现 建立 了 基 
础 。 为 了 建立 规则 系统 和 OWL2 RL 本 体 之 间 的 互 操作 性 ， 这 一 公理 化 可 以 使 用 RIF (BLD, 
实际 上 即使 是 更 简单 的 核心 ) 规则 来 描述 。 

OWL2 RL 规则 可 以 分 为 4 个 (不 相交 的 ) 类 别 : 三 元 组 模式 规则 、 不 一 致 性 规则 、 列 表 
规则 和 数据 类 型 规则 。 

三 元 组 模式 规则 这 些 规 则 从 RDF 三 元 组 模式 的 合 取 中 推导 某 些 RDF 三 元 组 。 这 些 规 
则 到 RIF 的 转换 (使 用 框架 公式 ) 很 简单 ， 使 用 如 下 形式 的 规则 8 : 

Group( 

Forall ?V1 ... ?Vn( 
s[p->0] :- And(sl[pl->ol]... sn[pn->on])) 
) 


不 一 致 性 规则 这 些 规则 指明 了 原始 RDF 图 (当然 ， 是 对 于 现 有 的 OWL 知识 而 言 ) 中 
的 不 一 致 。 这 样 的 规则 可 以 容易 地 使 用 RIF 来 表示 为 带 有 rifierror 结论 的 规则 ，rifierror 是 
RIF 命名 空间 中 的 一 个 谓词 符号 ， 用 来 描述 不 一 致 性 。 例 如 ， 当 两 个 谓词 已 经 被 声明 为 不 相 
交 ， 但 又 连接 到 同样 的 实体 时 ， 一 条 不 一 致 就 发 生 了 。 这 可 以 使 用 RIF 如 下 描述 : 

Group( 

Forall ?P1 ?P2 ?X ?Y( 
rif:error :- And( 
?P1[owl:propertyDisjointWith ?P2] ?X[?P1->?Y] ?X[?P2->?Y])) 

) 


列表 规则 一 些 OWL2 RL 规则 涉及 包括 RDF 列表 (HW owl :Al1Different) 的 


OWL 描述 的 处 理 。 有 两 种 方法 可 以 使 用 RIF 来 描述 这 些 规则 。 一 种 可 以 在 运行 时 使 用 递归 规 


日 ”为 提升 可 读 性 ， 这 些 规则 以 Prolog ( 反 向 ) 表示 法 给 出 ， 而 不 是 之 前 一 直 使 用 的 If-Then ( 正 向 ) 表示 法 。 
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则 来 遍历 RDF 图 ， 产 生 一 个 通用 的 表示 。 或 者 ， 可 以 采用 一 种 预 处 理 方法 ， 规 则 对 于 实际 出 
现在 输入 RDF 图 中 的 列表 直接 实例 化 ， 可 能 在 实际 中 表现 更 好 。 请 读者 阅读 转换 文档 (参见 
建议 阅读 ) 来 获取 细节 。 

数据 类 型 规则 ”这些 规 则 提供 了 类 型 检测 和 所 支持 的 数据 类 型 中 的 带 类 型 文字 的 值 相 
等 /不 相等 检测 。 例 如 ， 这 样 的 规则 对 于 数据 类 型 中 的 相同 的 值 (例如 1 和 1.0) 可 以 推导 出 
owl:sameAs 三 元 组 ,或 者 当 一 个 文字 被 指定 为 一 个 数据 类 型 的 实例 ,但 它 的 取 值 超出 了 那 
个 数据 类 型 的 值 空间 时 ， 可 以 推导 出 一 条 不 一 致 。 到 RIF 规则 的 转换 是 非常 简单 的 。 


5.7 SWRL 


SWRL (语义 网 规则 语言 ) 是 一 种 设计 出 的 结合 了 OWL DL 和 无 函数 Horn 逻辑 的 语义 网 
语言 ， 是 用 一 元 /二 元 Datalog RuleML (参见 5.11 节 ) 写 的 。 因 此 ， 它 允许 类 似 Hom 的 规则 
和 OWLDL 本 体 的 结合 。 

SWRL 规则 的 形式 如 下 : 


Bi,...,Bn Ai,..., Am 


FL ep i SK PM GES BAS AR, Aye, A, 和 Bi…, B, 可 以 形 如 C(x), P(x), sameds(x,y) 或 
者 differentFrom(x,y), FP C 是 一 个 OWL 描述 , P 是 一 个 OWL 属性 , Al y 是 Datalog 变量 、 
OWL 实例 或 者 OWL 数据 值 。 

如 果 一 个 规则 头 拥 有 超过 一 个 原子 ( 当 它 是 没有 共享 变量 的 若干 原子 的 合 取 时 )， 这 条 规 
则 可 以 容易 地 被 转换 成 一 个 等 价 的 规则 集合 ， 其 中 每 个 规则 头 含 有 一 个 原子 。 

SWRL 语言 的 主要 复杂 性 源 于 任意 的 OWL 描述 一 一 例如 限制 ， 都 可 以 出 现在 一 条 规则 
的 头 或 体 中 。 这 一 特征 为 OWL 添加 了 很 强 的 描述 能 力 ， 但 也 付出 了 不 可 判定 性 的 代价 ， 即 
没有 推理 引擎 能 推出 和 SWRL 语义 一 样 的 结论 。 

与 OWL2 RL 相 比 ，SWRL 在 集成 描述 逻辑 和 无 函数 规则 上 位 于 其 对 立 面 。OWL2 RL RK 
用 一 种 非常 保守 的 方式 ， 试 图 去 结合 两 种 语言 的 共同 子 语言 的 优点 。SWRL 采用 一 种 更 加 激 
进 的 方法 ， 合 并 了 它们 的 描述 能 力 。 从 实际 的 角度 出 发 ， 挑 战 在 于 识别 出 SWRL 的 子 语言 ， 
以 能 够 在 描述 能 力 和 计算 易 处 理性 之 间 找 到 正确 的 平衡 。 这 样 的 一 个 候选 子 语 言 是 OWL DL 
的 带 DL 安全 规则 (DL-safe rule) 的 扩展 ， 其 中 每 个 变量 必须 出 现在 规则 体 中 的 一 个 非 描 述 逻 
辑 原 子 中 。 参 见 建议 阅读 中 的 关于 集成 规则 与 描述 逻辑 的 论文 。 

注意 ,一 个 与 SWRL 相似 的 结果 可 以 通过 结合 RIF-BLD 和 OWL2 RL 来 获得 (参见 建议 
阅读 )。 


5.8 FA SPARQL 描述 规则 : SPIN 
规则 可 以 使 用 SPARQL 来 描述 ,使 用 其 CONSTRUCT 特征 。 例 如 ， 规 则 


grandparent(X, Z) + parent(Y, Z), parent(X,Y) 
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可 以 被 描述 为 : 
CONSTRUCT { 
?X grandParent ?Z. 
} WHERE { 
?Y parent ?Z. 
?X parent ?Y. 


} 


新 近 提 出 的 SPIN 以 此 为 起 点 提出 了 一 个 基于 SPARQL 的 建 模 语言 。 它 的 主要 思想 和 特 
征 包括 : 

。 使 用 面向 对 象 建 模 的 思想 将 规则 关联 到 类 ， 因 此 ， 规则 可 能 表示 那个 类 的 行为 ， 并且 
它们 自身 可 能 并 不 独立 存在 (尽管 全 局 规则 可 以 被 定义 )。 

。 使 用 SPARQL CONSTRUCT, DELETE, INSERT 以 及 使 用 SPARQL ASK 构造 子 的 约 
束 来 描述 规则 。 

e 使 用 模板 为 规则 提供 抽象 机 制 ， 其 本 质 上 封装 了 参数 化 的 SPARQL 查询 ; 用 户 定义 
的 SPIN 函数 作为 一 种 机 制 基于 更 简单 的 组 件 来 构建 更 高 层 的 规则 (复杂 的 SPARQL 
查询 )。 

作为 示例 ，OWL2 RL 规则 已 经 使 用 SPIN 来 描述 了 。 例 如 ， 规 则 


C2(X) Ci(X),equivalentClass(C1, C2) 
可 以 用 SPARQL 表示 为 : 
CONSTRUCT { 


?X a ?C2. 


} 
WHERE { 
?X a ?C1. 
?C1 equivalentClass ?C2. 


} 


并 被 实例 化 为 类 owl :Thing 上 的 一 条 spin:rule， 这 将 允许 这 条 规则 被 运用 于 所 有 可 能 的 
实例 。 

应 该 注意 的 是 ，SPARQL 及 SPIN 是 一 个 规则 语言 ， 不 是 一 个 实现 的 规则 系统 ; 例如 ， 
CONSTRUCT 只 能 描述 一 个 推理 步骤 (从 一 个 RDF 图 到 男 一 个 )。 一 个 基于 SPARQL 的 规则 
系统 (例如 一 个 SPIN 推理 引擎 ) 则 至 少 需要 迭代 地 执行 CONSTRUCT, 并且 当 存 在 递归 规则 
时 控制 递归 。 
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5.9 非 单调 规则 : 动机 和 语法 


5.9.1 漫谈 

现在 我 们 将 注意 力 集 中 到 非 单 调 规则 系统 上 。 到 目前 为 止 ， 只 要 一 条 规则 的 前 提 得 以 证 
明 ， 这 条 规则 就 可 以 被 运用 ， 它 的 头 会 作为 一 条 结论 推导 出 来 。 在 非 单调 规则 系统 中 ， 即 使 
一 条 规则 的 所 有 前 提 都 已 知 ， 它 也 未 必 会 被 运用 ， 因 为 我 们 不 得 不 考虑 对 立 的 推理 链 。 一 般 
而 言 ， 从 现在 起 ,我们 所 考虑 的 规则 称 为 可 废止 的 ( defeasible)， 因 为 它们 可 以 被 其 他 规则 击 
败 。 为 了 支持 规则 间 的 冲突 ， 否 定 的 原子 公式 (negated atomic formula) 可 以 出 现在 规则 的 头 
和 体 中 。 例 如 ， 我 们 可 以 写成 

p(X) > g(X) 

r(X) > 7q(X) 


为 了 区 分 可 废止 规则 和 标准 的 单调 规则 ， 我 们 用 一 种 不 同 的 箭头 : 

p(X) = g(X) 

r(X) = 7q(X) 
在 这 个 例子 中 ， 也 给 定 如 下 事实 

p(a) 

r(a) 
我 们 既 推 不 出 g(a) 也 推 不 出 -9g(@)。 这 是 一 个 典型 的 两 条 规则 互相 阻止 对 方 的 例子 。 这 一 冲 
突 可 以 通过 使 用 规则 间 的 优先 级 (priorities among rules) 来 消解 。 假 设 我 们 通过 某 种 方式 知道 
第 一 条 规则 比 第 二 条 规则 要 强 ， 那 么 我 们 就 可 以 推导 出 q(a)。 

优先 级 在 实际 中 自然 形成 ， 可 能 基于 各 种 各 样 的 原则 : 
一 条 规则 的 来 源 可 能 比 另 一 条 规则 的 来 源 更 可 靠 ， 或 者 它 可 能 具有 更 高 的 权威 性 。 例 
如 ， 联 邦 法 律 优 于 州立 法 律 ; 在 商业 管理 中 ， 高 层 管理 比 中 层 管理 具有 更 高 的 权威 。 
一 条 规则 可 能 因为 它 更 新 而 优 于 另 一 条 。 
一 条 规则 可 能 因为 它 更 加 具体 而 优 于 男 一 条 。 一 个 典型 的 例子 是 带 有 若干 例外 情况 的 
一 条 通用 的 规则 ， 在 这 样 的 情况 下 ， 例 外 就 比 通用 规则 更 强 。 

具体 性 经 常 基于 给 定 的 规则 来 计算 ， 但 另 两 条 原则 不 能 从 逻辑 形式 化 来 确定 。 因 此 ,我 
们 从 特定 的 优先 级 原则 中 抽象 出 来 ， 假 设 在 规则 集 上 存在 一 个 外 部 的 优先 级 关系 (external 
priority relation)。 为 了 从 语法 上 描述 这 个 关系 ,我 们 扩展 规则 语法 来 加 入 一 个 独特 的 标记 。 
例如 ， 

rı : P(X) = q(x) 


ra: 7(X) = 7q(X) 
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可 以 写成 


Ti > T2 


来 指明 ry; bk r Io 
我 们 并 不 在 “> ”上 施加 太 多 条 件 ， 甚 至 不 要 求 规则 形成 一 个 完整 的 序 。 我 们 只 要 求 优先 
级 关系 是 无 环 的 ， 即 不 可 能 有 如 下 形式 的 圈 : 


TST. > 202 PTH > FY 


注意 ， 优 先 级 是 用 来 消解 竞争 规则 (competing rule) 之 间 的 冲突 的 。 在 简单 情况 下 ， 两 
条 规则 是 竞争 的 ， 仅 当 一 条 规则 头 是 另 一 条 规则 头 的 否定 。 但 在 应 用 中 ， 经常 出 现 的 情况 是 
只 要 一 个 谓词 p 推导 出 来 了 ,一 些 其 他 的 谓词 就 要 被 排除 出 去 。 例 如 ， 一 个 投资 顾问 可 能 根 
据 投 资 人 愿意 承受 的 风险 级 别 的 不 同 将 他 的 推荐 分 为 三 层 : 低 、 中 和 高 。 每 个 投资 人 在 任何 
时 刻 只 人 允许 接受 一 个 风险 级 别 。 技 术 上 来 说 ， 这 些 情 况 是 通过 为 每 个 文字 工 维 护 一 个 冲突 集 
CIL) KN. CL) 总 是 包含 元 的 和 否定， 但 可 以 包含 更 多 的 文字 。 


5.9.2 ”语法 定义 
可 废止 规则 (defeasible rule) 的 形式 如 下 : 


其 中 + 是 标记 (label), {L,,---, L,} 是 体 (body) 或 前 提 (premise), 工 是 规则 头 (head). L, 
Lyn, Ly 是 肯定 或 否定 的 文字 (一 个 文字 是 一 个 原子 公式 phr, tg) 或 其 否定 ADC, ty) 
函数 符号 不 能 出 现在 规则 中 SS。 有 时 候 我 们 将 一 条 规则 的 头 记 为 head(r)， 体 记 为 body(r)。 稍 
微 混用 一 下 ， 有 时 候 也 用 标记 r 来 指 代 整 条 规则 。 

可 废止 逻辑 程序 (defeasible logic program) 是 一 个 三 元 组 (FR, >)， 由 一 个 事实 集 下 、 一 
个 有 限 的 可 废止 规则 集 R 和 一 个 R 上 的 无 环 二 元 关系 “>”( 准 确 地 说 ， 一 个 r>r' 对 构成 的 集 
合 ， 其 中 r+ 和 wx 是 R 中 规则 的 标记 ) 组 成 。 


5.10” 非 单调 规则 的 例子 : 交易 中 介 


这 个 例子 展现 了 规则 怎样 应 用 于 电子 商务 应 用 (其 理想 地 运行 于 语义 网 上 ) 中 。 交 易 中 介 
通过 一 个 独立 的 第 三 方 一 一 中 间 人 来 进行 。 中 间 人 匹配 买方 的 需求 和 卖方 的 能 力 ， 提 出 一 笔 
双方 都 满意 的 交易 。 

作为 一 个 具体 应 用 ， 我 们 将 讨论 公寓 租赁 9 一 一 一 种 往往 是 乏味 和 费时 的 常见 活动 。 合 i 
的 万 维 网 服务 可 以 很 大 程度 上 减少 工作 。 我 们 首先 呈现 潜在 租户 的 需求 。 

Carlos 正 寻 找 一 间 至 少 45 平方 米 、 至 少 带 有 两 间 卧 室 的 公寓 。 如 果 位 于 三 楼 或 者 更 高 ， 

这 幢 楼 就 必须 有 电梯 。 并 且 ， 必 须 允 许 饲 养 完 物 。 


日 ”施加 这 一 约束 是 因为 技术 上 的 原因 ， 其 讨论 超出 了 本 章 的 范围 。 
日 ”在 这 个 例子 中 ,房东 扮 演 了 抽象 卖方 的 角色 。 
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Carlos 希望 为 位 于 市 中 心 的 45 平方 米 的 公寓 支付 300 美元 ， 而 对 于 郊区 的 类 似 公 寓 则 支 
付 250 美元 。 此 外 ， 他 愿意 为 更 大 的 公寓 额外 支付 每 平方 米 5$ 美元 ， 为 一 个 花园 额外 支付 每 

他 总 共 不 能 支付 超过 400 美元 。 如 果 有 几 个 选择 ， 他 将 挑 最 便宜 的 那个 选项 ; 他 第 二 优 
先 考 虑 的 是 花园 ; 最 后 考虑 的 是 额外 的 空间 。 


5.10.1 Carlos 的 需求 的 形式 化 
我 们 使 用 以 下 谓词 来 描述 公寓 的 属性 : 
apartment(x) 表明 x 是 一 间 公 寓 
size(x,y) y EAN x WM (单位 : 平方 米 ) 
bedroom(x,y) ”x 有 y 间 卧室 
price(x,y) 上 是 x 的 价格 
floor(x,y) x 在 第 y 层 
garden(x,y) XxX 有 一 个 面积 为 y 的 花园 
elevator(x) x 的 楼 里 有 一 部 电梯 


pets(x) x 允许 饲养 宠物 
central(x) x 位 于 市 中 心 
我 们 也 使 用 以 下 谓词 : 
acceptable(x) 2N% x Æ Carlos 的 需求 
offer(x,y) Carlos RE AAS x ft y 美元 


现在 我 们 陈述 Carlos 的 硬性 需求 。 任 何 公寓 预先 都 被 认为 是 可 接受 的 。 
rı: apartment(X) = acceptable(X) 
然而 ， 只 要 Carlos 的 一 个 需求 无 法 满足 ，7 就 是 不 可 接受 的 。 
r2 : bedrooms(X,Y),Y < 2 = —acceptable(X) 
r3: size(X,Y),Y < 45 => —acceptable(X) 
r4: —pets(X) > —acceptable(X) 
r5: floor(X,Y),¥ > 2,-7lift(X) = —acceptable(X) 
re : price(X,Y),Y > 400 => —acceptable(X) 


规则 产 ~ rs 是 规则 x 的 例外 ， 所 以 增加 


Te > Tis Th > fis Th > Tia TB > Tis Të > fi 
接 下 来 ， 计 算 Carlos 愿意 为 一 间 公 寓 支 付 的 价格 。 


r7 : size(X,Y),Y > 45, garden(X, Z), central(X) = 





offer(X, 300 + 2Z +5(Y — 45)) 
rg: size(X,Y),Y > 45, garden(X, Z), acentral(X) > 
offer(X,250 + 27+ 5(Y — 45)) 


一 间 公 寓 是 可 以 接受 的 仅 当 Carlos 愿意 支付 的 钱 数 不 少 于 房东 指定 的 价格 (我 们 假设 不 能 讨 
价 还 价 )。 


rg: offer(X,Y), price(X,Z),Y < Z = 7acceptable(X) 


Tg > Tı 


5.10.2 ”可 获得 的 公寓 的 表示 
每 间 可 获得 的 公寓 都 被 赋予 一 个 唯一 的 名 字 ， 它 的 属性 被 表示 为 事实 。 例 如 ， 公 寓 a 可 
能 如 下 描述 : 
bedrooms(a1, 1) 
size(a1, 50) 
central(a1) 
floor(a1, 1) 
elevator (a1) 
pets(a1) 
garden(a1, 0) 
price(a1, 300) 


可 获得 的 公寓 的 描述 汇总 在 表 5-1 中 。 在 实际 中 ， 可 提供 的 公寓 可 以 存储 在 一 个 关系 数 
据 库 中 ， 或 者 在 语义 网 环境 下 ， 存 储 在 一 个 RDF 存储 系统 中 。 


表 5-1 可 获得 的 公寓 
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如 果 匹 配 Carlos 的 需求 和 可 获得 的 公寓 ,我 们 发 现 

。 公寓 a 不 可 接受 ， 因 为 它 只 有 一 间 卧 室 (规则 r); 

。 公寓 a, 和 as 不 可 接受 ， 因 为 不 允许 饲养 宠物 (规则 x, ); 

e 对 于 a, Carlos 愿意 支付 的 是 300 美元 ， 但 它 的 价格 超出 了 (规则 x; 和 x ); 

。 AH a. a; 和 a 是 可 接受 的 (规则 x )。 
5.10.3 . 选择 一 间 公 寓 

到 目前 为 止 ， 我 们 已 经 识别 出 了 Carlos 可 以 接受 的 公寓 。 这 个 选择 本 身 是 有 价值 的 ， 因 
为 它 将 注意 力 集中 于 相关 的 公寓 ， 从 而 有 可 能 接 下 来 进行 手工 检查 。 但 通过 考虑 更 多 的 偏好 ， 
也 有 可 能 进一步 降低 数量 ， 甚 至 降 到 只 剩 一 间 公 寓 。Carlos 的 偏好 按 序 分 别 是 价格 、 花 园 面 
积 、 面 积 。 我 们 如 下 表示 它们 : 


rio: acceptable( X) = cheapest(X) 


rıı : acceptable( X), price( X, Z), acceptable(Y ), price(Y, W), 
W < Z => —cheapest(X) 


rig: cheapest(X) => largestGarden( X) 


rı3 : cheapest( X), garden Size(X, Z), cheapest(Y ), 
gardenSize(Y,W),W > Z = -largestGarden(X) 


r14 : largestGarden(X) => rent(X) 


ris: largestGarden(X), size(X, Z), largestGarden(Y ), 
size(Y,W),W > Z => 7rent(X) 


T11 > T10; T13 > T12, Tis > 714 


规则 ro 表明 每 间 可 接受 的 公寓 默认 来 说 都 是 最 便宜 的 。 然 而 ， 如 果 有 一 间 可 接受 的 公寓 
LEX EER, HU ra CEC mo 更 强 ) 将 起 作用 并 推出 XX 不 是 最 便宜 的 。 

类 似 地 ， 规 则 x, 和 mm; 从 最 便宜 的 公寓 中 选择 拥有 最 大 花园 的 那些 公寓 。 在 它们 之 中 ， 
规则 ms 和 ys 再 基于 公寓 面积 选择 了 推荐 的 公寓 来 租赁 。 

在 我 们 的 例子 中 ， 公 寓 a 和 as 是 最 便宜 的 。 它 们 之 中 ，a; 拥有 最 大 的 花园 。 注 意 在 这 个 
例子 中 ， 公 寓 面 积 标准 并 不 起 作用 : ra 仅 对 as 有用， 而 规则 x; 没有 运用 。 因 此 ， 就 做 出 了 
一 个 选择 ，Carlos 很 快 会 搬 进 去 。 


5.11 RuleML 
RuleML (规则 标记 语言 ) 是 一 项 致力 于 开发 万 维 网 上 规则 标记 的 长 期 努力 。 它 实际 上 并 


98 RSF 





不 是 一 门 语言 ， 而 是 一 艇 规则 标记 语言 ， 对 应 于 不 同 种 类 的 规则 语言 :推导 规则 、 完 整 性 约 = 
束 、 反 应 规则 ， 等 等 。RuleML 簇 的 内 核 是 Datalog， 即 无 函数 的 Horn 逻辑 。 

RuleML 实验 性 地 研究 规则 语言 的 各 种 特征 ， 还 远 没 有 被 标准 化 〈 例 如 非 单调 规则 )。 其 
想法 是 这 些 努力 可 以 进入 未 来 的 标准 中 ， 就 如 同 RuleML 的 结果 曾 是 RIF 开发 中 的 一 个 重要 
组 件 那 样 。 

RuleML fk tE fk T XML 方式 的 规则 标记 语言 的 描述 ， 以 RELAX NG 或 XML 模式 的 方 
A (或 者 对 于 更 早 的 版 本 是 文档 类 型 定义 )。 规 则 成 分 的 表达 是 简单 的 。 图 5-1 描述 了 Datalog 
RuleML 的 关键 词汇 表 。 


规则 成 分 RuleML 










[au ee | 
ee ee | 
ee | 

conta a eT 





图 5-1 RuleML 词汇 表 


使 用 RuleML 词汇 来 描述 规则 是 简单 的 。 例 如 ， 规 则 “如 果 一 个 优质 顾客 购买 了 一 件 奢 
侈 产品 ， 那 么 这 个 顾客 得 到 的 折扣 是 7.5%” 用 RuleML 1.0 如 下 表示 。 


<Implies> 
<then> 
<Atom> 
<Rel>discount</Rel> 
<Var>customer</Var> 
<Var>product</Var> 
<Ind>7.5 percent</Ind> 
< /Atom> 
</then> 
<if> 


<And> 
<Atom> 


<Rel>premium</Rel> 
<Var>customer</Var> 
</Atom> 
<Atom> 


<Rel>luxury</Rel> 


EASE; 规划 
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<Var>product</Var> 
</Atom> 
</And> 
</if> 


</Implies> 


5.7 节 中 介绍 的 SWRL 语言 是 RuleML 的 一 个 扩展 ， 并 且 它 的 使 用 是 直接 的 。 举 例 而 言 ， 


对 于 这 条 规则 
brother(X,Y), childOf(Z,Y) > uncle(X, Z) 
用 基于 RuleML 1.0 的 SWRL 的 XML 语法 表示 如 下 : 


<ruleml:Implies> 
<ruleml:then> 
<swrix:individualPropertyAtom swrlx:property="uncle" > 
<ruleml:Var>X</ruleml:Var> 
<ruleml:Var>Z</ruleml:Var> 
</swrix:individualPropertyAtom> 
</ruleml:then> 
<ruleml:if> 
<ruleml:And> 
<swrlx:individualPropertyAtom swrlx:property="brother" > 
<ruleml:Var>X</ruleml:Var> 
<ruleml:Var>Y </ruleml:Var> 
</swrlx:individualPropertyAtom> 
<swrlx:individualPropertyAtom swrlx:property="childOf" > 
<ruleml:Var>Z</ruleml:Var> 
<ruleml:Var>Y</ruleml:Var> 
</swrlx:individualPropertyAtom> 
</ruleml:And> 
</ruleml:if> 


</ruleml:|mplies> 


5.12 ”小结 
(语义 ) 网 上 的 规则 形成 了 一 个 非常 丰富 且 异 构 的 景象 


© Horn 逻辑 是 谓词 逻辑 的 一 个 支持 高 效 推理 的 子 集 。 它 形成 了 一 个 正 交 于 描述 逻辑 的 子 


集 。Horn 逻辑 是 单调 规则 的 基础 。 
RIF 是 一 个 万 维 网 上 规则 的 新 标准 。 它 的 逻辑 方言 BLD 基于 Horn 逻辑 。 
© OWL2 RL 本 质 上 是 描述 逻辑 和 Horn PEZE, AT WA RIF 中 。 


。 SWRL 是 一 种 更 加 丰富 的 规则 语言 ， 结 合 了 描述 逻辑 的 特征 和 规则 的 受 限 类 型 。 
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。 当 可 获得 的 信息 不 完整 时 ， 非 单调 规则 是 有 用 的 。 它 们 是 那些 可 以 被 相反 证 据 (其 他 
规则 ) 覆盖 的 规则 。 
© 优先 级 用 来 消解 非 单调 规则 之 间 的 一 些 冲 突 。 
。 用 类 似 XML 的 语言 来 表达 规则 ， 例 如 RIF 和 RuleML 提供 的 那样 ， 是 直接 的 。 


建议 阅读 

Horn 光 辑 在 逻辑 中 是 一 个 标准 的 主题 。 更 多 的 信息 可 以 在 相关 教科 书 中 找到 ， 例 如 : 

e E. Burke and E. Foxley. Logic and Its Applications. Upper Saddle River, N.J.: Prentice Hall, 
1996. 

e M. A. Covington, D. Nute, and A. Vellino. Prolog Programming in Depth, 2nd ed. Upper 
Saddle River, N.J.: Prentice Hall, 1997. 

e A. Nerode and R. A. Shore. Logic for Applications. New York: Springer, 1997. 

e U. Nilsson and J. Maluszynski. Logic, Programming and Prolog, 2nd ed. New York: Wiley, 1995. 

ə N. Nissanke. /ntroductory Logic and Sets for Computer Scientists. Boston: Addison-Wesley, 1998. 

非 单调 规则 是 一 个 相当 新 的 主题 。 信 息 可 以 在 上 述 第 二 本 教科 书 以 及 以 下 论文 中 找到 : 

e G. Antoniou, D. Billington, G. Governatori, and M. J. Maher. Representation Results for 
Defeasible Logic. ACM Transactions on Computational Logic 2 (April 2001): 255-287. 


N. Bassiliades, G. Antoniou, and I. Vlahavas. A Defeasible Logic Reasoner for the Semantic 
Web. International Journal on Semantic Web and Information Systems 2,1 (2006): 1-41. 

è T. Eiter, T. Lukasiewicz, R. Schindlauer, and H. Tompits. Combining Answer Set 
Programming with Description Logics for the SemanticWeb. In Proceedings of the 9th 
International Conference on Principles of Knowledge Representation and Reasoning 

(KR 04), AAAI Press 2004, 141-151. 

e D. Nute. Defeasible Logic. In Handbook of Logic in Artificial Intelligence and Logic 
Programming Vol. 3, ed. D. M. Gabbay, C. J. Hogger, and J. A. Robinson. New York: 
Oxford University Press, 1994. 

关于 RIF 及 其 与 RDF 和 OWL 的 兼容 性 的 信息 可 以 在 以 下 网 址 找到 

e http://www.w3.org/2005/rules/wiki/Primer. 

e http://www.w3.org/TR/rif-overview/. 

e http://www.w3.org/TR/rif-bld/. 

è http://www.w3.org/TR/rif-rdf-owl/. 

对 RIF-BLD 的 形式 化 基础 的 介绍 可 以 在 以 下 文献 中 找到 : 

M. Kifer. Knowledge Representation and Reasoning on the Semantic Web: RIF. In Handbook 

of Semantic Web Technologies, eds. J. Domingue, D. Fensel, and J. Hendler. Springer 2011. 
关于 OWL2 RL AAAKA RIF 的 信息 可 以 在 以 下 网 址 找到 : 

e http://www.w3.org/TR/owl2-profiles/. 
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© http://www.w3.org/TR/rif-owl-rl/. 

关于 SPIN 及 其 对 部 分 OWL2 RL 的 编码 的 信息 可 以 在 以 下 网 址 找到 : 

e http://www.w3.org/Submission/spin-overview/. 

e http://topbraid.org/spin/owlrl-all.html. 

关于 SWRL 的 信息 可 以 在 以 下 网 址 找到 : 

e http://www.w3.org/Submission/SWRL/. 

其 他 在 集成 规则 与 描述 逻辑 方面 的 重要 工作 包括 : 

e I. Horrocks, P. Patel-Schneider, S. Bechhofer, and D. Tsarkov. OWL Rules: A Proposal and 
Prototype Implementation. Journal of Web Semantics 3,1 (2005): 23—40. 


www.websemanticsjournal.org/ps/pub/2005-2. 


e B. Motik, U. Sattler, and R. Studer. Query Answering for OWL-DL with Rules. Journal of 


Web Semantics 3,1 (2005): 41-60. 


www.websemanticsjournal.org/ps/pub/2005-3. 


R. Rosati. On the Decidability and Complexity of Integrating Ontologies and Rules. Journal 
of Web Semantics 3,1 (2005): 61-73. 

www.websemanticsjournal.org/ps/pub/2005-4. 

关于 规则 标记 语言 及 它们 在 语义 网 中 的 应 用 的 一 般 信息 可 以 在 RuleML 网 站 找到 : 


e www.ruleml.org/. 


练习 和 项 目 


以 下 项 目 使 用 规则 技术 。 假 设 读者 已 经 具备 了 基本 的 语义 网 技术 的 知识 和 经 验 。 如 果 没 
有 ， 最 好 先 做 一 些 基本 的 项 目 (参见 第 7 章 )。 
语义 中 介 

1. 这 个 基本 的 项 目 可 以 由 两 个 人 在 2 或 3 周 内 完成 。 目 的 是 实现 一 个 类 似 于 5.10 节 中 公 
寅 租赁 例子 的 应 用 。 完 成 以 下 任务 : 

(a) 选择 一 个 中 介 活 动 将 要 进行 的 主题 。 这 里 中 介 指 的 是 匹配 供给 和 需求 。 

(b) 为 这 个 领域 构建 一 个 RDFS 本 体 。 

(c) 用 一 些 供给 来 实例 化 本 体 ， 用 RDF 描述 

(d) 使 用 非 单调 规则 来 描述 选择 标准 。 

(e) 使 用 一 个 诸如 DR-DEVICE 8 或 者 DR-Prolog 9 的 引擎 来 运行 你 的 规则 及 RDF/RDFS 
信息 。 为 此 ， 你 将 需要 用 这 些 系统 指定 的 格式 来 描述 规则 。 

2. 这 个 高 级 的 项 目 可 以 由 2 或 3 个 人 在 一 个 学 期 内 完成 ， 目 的 是 在 一 个 多 智能 体 环境 中 
实现 一 个 中 介 场 景 。 除 了 执行 项 目 5.4 中 描述 的 步骤 以 外 ， 项 目 参与 者 至 少 需要 


http://lpis.csd.auth.gr/systems/dr-device.html. 
© http://www.csd.uoc.gr/~bikakis/DR-Prolog/ 
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(a) 通过 学 习 一 些 相关 文献 来 建立 对 多 智能 体 环境 中 的 中 介 的 基本 理解 : 

K. Sycara, S. Widoff, M. Klusch, and J. Lu. Larks: Dynamic Matchmaking among 
Heterogeneous Software Agents in Cyberspace. Autonomous Agents and Multi-Agent Systems 5, 2 
(2002): 173-203. 

G. Antoniou, T. Skylogiannis, A.Bikakis, and N. Bassiliades. A Deductive Semantic Brokering 
System.In Proceedings of the 9th International Conference on Knowledge-Based Intelligent 
Information and Engineering Systems. LNCS 3682, Springer 2005,746—752. 

(b) 自己 去 选择 并 熟悉 一 个 多 智能 体系 统 。 我 们 已 经 在 JADE ©S 上 有 了 很 好 的 经 验 。 

(c) 决定 智能 体 之 间 交 换 的 准确 消息 。 

(d) 了 解 如 何 去 远 程 调用 要 使 用 的 推理 引擎 。 

证 明 层 

这 些 项 目的 目标 是 实现 一 个 证 明 层 ， 其 概况 已 经 在 第 1 章 中 简要 概述 了 。 注 意 ， 并 不 存 
在 单一 的 证 明 层 ， 而 是 每 个 选择 的 语义 网 推理 系统 GE) 都 有 一 个 证 明 层 。 然 而 ， 一 些 考虑 
对 于 所 有 这 样 的 系统 都 是 通用 的 。 可 以 为 两 种 可 能 的 逻辑 系统 实现 一 个 证 明 层 。 

一 种 简单 的 单调 规则 语言 ， 例 如 Datalog (没有 函数 符号 的 Horn 逻辑 )， 其 中 可 以 使 用 
推理 工具 Mandarax ©; 

一 种 非 单调 规则 语言 ， 像 本 章 中 讨论 的 那样 ， 其 中 可 以 使 用 DR-DEVICE 或 者 DR- 
Prolog ®, 

3. 这 个 基本 的 项 目 可 以 由 2 或 3 个 人 在 大 约 两 个 月 内 完成 。 目 的 是 开发 一 个 交互 式 系 统 
向 用 户 提 供 解释 。 需 要 涉及 的 重要 方面 包括 以 下 几 点 。 

(a) 决定 如 何 从 整体 证 明 轨 人 迹 中 抽取 相关 的 信息 。 你 可 以 查阅 自动 推理 和 逻辑 编程 的 文献 

(b) 为 表示 证 明 过 程 定义 颗粒 度 级 别 。 应 该 展现 整个 证 明 还 是 仅仅 一 些 元 步骤? 当 用 户 问 
到 某 一 个 步骤 时 ， 这 些 可 以 重 定义 。 

(c) 最 终 ， 一 个 证 明 的 “叶子 ”将 会 是 RDF 事实 、 规 则 或 者 用 到 的 推理 条 件 。 

4. 4 或 5 个 人 可 以 在 一 个 学 期 内 完成 这 个 项 目 。 目 标 是 在 一 个 多 智能 体 环境 中 实现 一 个 
证 明 层 一 一 即 请 求 和 证 明 部 分 将 在 智能 体 之 间 交 换 。 额 外 需要 考虑 的 包括 以 下 方面 。 

(a) 自己 去 选择 并 熟悉 一 个 多 智能 体系 统 。 我 们 已 经 在 JADE 9 上 有 了 很 好 的 经 验 。 

(b) 用 一 种 XML 语言 表示 证 明 ， 最 好 是 通过 扩展 RuleML 。 

(c) 决定 用 于 在 智能 体 之 间 交 换 的 精确 消息 。 


http://jade.tilab.com/ s 
http://mandarax.sourceforge.net/, 
http://Ipis.csd.auth.gr/systems/dr-device.html o 
http://www.csd.uoc.gr/~bikakis/DR-Prolog/ > 
http://jade.tilab.com/. 
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最 近 几 年 ， 语 义 网 技术 的 运用 已 经 显著 加 速 ， 而 语义 网 应 用 刚 萌 芽 的 那 几 年 
(2000 ~ 2007 年 ) 则 主要 是 被 未 全 面 投产 的 工业 和 学 术 原 型 系统 主导 。 近 年 来 (从 2008 年 
起 )， 在 商业 和 贸易 的 很 多 领域 ， 已 经 出 现 了 全 面 投产 的 、 核 心 基 于 语义 网 技术 的 系统 。 本 章 
将 简要 描述 一 些 这 样 的 应 用 。 


我 们 介绍 GoodRelations 本 体 的 部 署 是 如 何 开 始 改变 在 线 零 售 领 域 的 功能 的 (6.1 节 )， 
BBC 是 如 何 利用 语义 网 技术 来 维护 和 发 布 他 们 的 艺术 家 和 音乐 档案 的 ( 6.2 节 ) 以 及 服务 于 他 
们 高 级 别 体育 赛事 的 报道 的 (6.3 节 )， 政 府 是 如 何 使 用 语义 网 技术 来 发 布 他 们 的 数据 的 (6.4 
节 )， 以 及 以 《纽约 时 报 》 为 例 的 出 版 业 是 如 何 使 用 语义 网 技术 的 (6.5 节 )。 最 后 ,我 们 通过 75 
介绍 Sig.ma (6.6 节 )、OpenCalais ( 6.7 节 ) 和 Schema.org ( 6.8 节 ) 来 讨论 万 维 网 搜索 的 未 来 。 


6.1 GoodRelations 


6.1.1 BR 


电子 商务 ， 特 别 是 企业 对 消费 者 (Business-to-Consumer，B2C) 的 电子 商务 ,已 经 成 为 万 
维 网 快速 融入 日 常生 活 的 主要 驱动 力 之 一 。 如 今 ， 在 店面 和 货车 上 看 见 URL 已 经 不 稀奇 了 。 
以 英国 为 例 ,B2C 市 场 已 经 从 2000 年 4 月 的 8700 万 英镑 增长 到 了 2009 年 年 底 的 684 亿 英 镑 ， 
在 10 年 中 增长 了 1000 倍 。 

这 一 巨大 的 电子 商务 市 场 受 到 传统 万 维 网 所 含 缺 陷 的 影响 : 电子 商务 网 站 通常 从 结构 化 
的 信息 系统 中 生成 ， 罗 列 价格 、 可 获得 性 、 产 品类 型 、 交 付 选项 等 ， 但 当 这 些 信息 抵达 公司 
的 网 页 中 时 ， 已 经 被 转换 为 HTML， 所 有 机 器 可 理解 的 结构 已 经 消失 了 ， 甚 结果 是 机 器 没 法 
再 区 分 一 个 价格 和 一 个 产品 代码 。 搜 索引 擎 在 解释 它们 试图 去 爬 取 和 索引 的 电子 商务 网 页 时 
受 此 影响 ， 不 能 正确 地 区 分 产品 类 型 或 者 形成 有 意义 的 产品 分 组 。 

GoodRelations S 是 与 OWL 相符 的 本 体 ， 描 述 了 电子 商务 领域 。 它 可 以 用 来 描述 产品 的 供 
给 、 指 明 价 格 、 描 述 业 务 ， 等 等 。GoodRelations 的 RDFa 语法 允许 这 一 信息 被 谋 入 现 有 的 网 
页 中 ,使 得 它们 可 以 被 其 他 计算 机 处 理 。GoodRelations 的 主要 好 处 及 其 日 益 普 及 的 主要 驱动 
力 是 它 对 搜索 的 改进 。 将 GoodRelations 添加 到 网 页 中 ， 可 以 改进 供给 在 现代 搜索 引擎 和 推荐 
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系统 中 的 能 见 度 。GoodRelations 支持 万 维 网 上 产品 和 服务 的 标注 ， 其 采用 的 方式 可 以 被 搜索 
引擎 用 来 向 它们 的 用 户 传递 一 种 更 好 的 搜索 体验 。 它 支持 非常 具体 的 搜索 查询 并 给 出 非常 精 
确 的 答案 。 

除了 关于 产品 和 提供 者 的 信息 以 外 ，GoodRelations 本 体 也 允许 描述 商业 和 电子 商务 交易 
的 功能 细节 ， 例 如 符合 条 件 的 国家 、 支 付 和 交付 选项 、 数 量 折扣 、 营 业 时 间 等 。 

GoodRelations 本 体 S 包 括 了 诸如 gr: ProductOrServiceModel, gr:PriceSpecification, 
gr:OpeningHoursSpecification 和 gr:DeliveryChargeSpecification 等 类 ， 以 及 
gr:typeOfGood, gr:acceptedPaymentMethods, gr:hasCurrency fll gr:eligible- 
Regions 等 属性 。 


6.1.2 #0 


我 们 展现 一 个 简单 但 真实 的 例子 ,来 自 于 德国 销售 聚会 服饰 的 Karneval Alarm 商店 的 网 
页 。 一 个 特定 的 网 页 9 描述 了 一 件 超人 服饰 ， 尺寸 是 48/50， 售 价 为 59.90 欧元 。 这 个 产品 
(在 Karneval Alarm 的 目录 中 编号 为 935 ) 用 RDF 实体 offering 935 来 表示 ， 这 个 产品 的 
网 页 使 用 了 RDFa 语法 ,包含 以 下 RDF 语句 : 


offering_935 gr:name "Superman Kostum 48/50" ; 
gr:availableAtOrFrom http: //www.karneval-alarm.de/#shop ; 
gr:hasPriceSpecification UnitPriceSpecification 935 . 
UnitPriceSpecification 935 gr:hasCurrency "EUR" ; 
gr:hasCurrencyValue "59.9" ; 
gr:valueAddedTaxIncluded "true" . 


这 些 描述 也 可 以 使 用 Sindice 的 RDFa 检查 器 8 在 线 浏览 89。 图 6-1 呈现 了 完整 的 图 ， 或 者 
使 用 一 个 在 线 可 缩放 的 视图 ®。 
当然 ， 这 样 的 GoodRelations 标注 需要 提 及 产品 类 型 和 种 类 。 为 此 ，Product 本 体 S 描 述 了 
来 自 维基 百科 网 页 的 产品 。 
举 个 例子 
pto:Party_ costume a owl:Class; 
rdfs:subClassOf gr:ProductOrService; 
rdfs:label "Party Costume" @en; 


rdfs:comment """A party costume is clothing...""@en 


其 允许 我 们 叙述 


offering_935 pr:typeOfGood pto:Party_ Costume 


http://www.heppnetz.de/ontologies/goodrelations/v1 . 

http://www.karneval-alarm.de/superman-m.html. 

http://inspector.sindice.com/., 

http://www.karneval-alarm.de/superman-m.html . 

http://inspector.sindice.com/inspect?url=http%3 A//www.karneval-alarm.de/superman-m.html#GRAPH. 
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图 6-1 从 一 件 超人 服饰 的 产品 网 页 中 提取 出 的 RDFa 标记 


Product 本 体 包括 了 几 十 万 个 产品 的 OWL DL 类 定义 。 这 些 类 定义 与 维基 百科 紧 耦 合 : 
维基 百科 中 的 编辑 会 反映 在 Product 本 体 中 。 这 意味 着 ， 如 果 一 个 供应 商 销售 一 件 没有 列 在 
Product 本 体 中 的 产品 ， 他 们 可 以 为 它 在 维基 百科 上 创建 一 个 网 页 ， 其 产品 类 型 将 在 24 ais 
内 出 现在 Product 本 体 中 。 


6.1.3 运用 
第 一 家 大 规模 采用 GoodRelations 本 体 的 公司 是 百思买 (BestBuy) 一 一 一 家 美国 大 型 消 


费 电 器 零售 商 。 百 思 买 报告 了 其 采用 了 GoodRelations 的 网 页 的 搜索 流量 增长 了 30%， 点 击 率 
也 大 幅 提 升 。Google 正 推荐 使 用 GoodRelations 来 语义 标注 电子 商务 网 页 ，Yahoo 和 Google 
IE ZENER RDFa 语句 并 用 它们 来 增强 其 搜索 结果 的 呈现 。 在 写作 本 书 时 ， 其 他 采用 者 还 包括 
Overstock.com FE R, O'Reilly Media 出 版 社 、Peek & Cloppenburg 服装 连锁 店 以 及 一 些小 
型 企业 ， 诸 如 Robinson Outdoors 和 之 前 提 到 的 Karneval Alarm。 在 写作 本 书 时 ，Sindice 语义 
搜索 引擎 列 出 了 27.3 万 个 带 GoodRelations 词汇 标注 的 网 页 。 


6.1.4 著作 


Martin Hepp. GoodRelations: An Ontology for Describing Products and Services Offerson 
the Web. In Proceedings of the 16th International Conference on KnowledgeEngineering and 
Knowledge Management (EKAW2008). Acitrezza, Italy. September29 — October 3, 2008. Springer 
LNCS, Vol 5268, 332-347. 


6.2 BBC 艺术 家 


6.2.1 背景 
BBC Music Beta 项 目 S9 是 BBC 的 一 项 努力 ， 构 建 关 于 有 歌曲 在 BBC 电台 播放 的 艺术 家 
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和 歌唱 家 的 语义 链接 和 标注 网 页 。 在 这 些 网 页 中 ， 数 据 集 增强 了 ， 并 与 语义 元 数据 互联 起 来 ， 
让 音乐 爱好 者 可 以 探索 他 们 可 能 不 曾 知道 的 音乐 家 之 间 的 联系 。 

此 前 ，BBC 的 编辑 们 不 得 不 在 他 们 发 布 的 每 个 艺术 家 的 网 页 上 写 上 (并 保持 更 新 ) 有 趣 
而 相关 的 内 容 。 取 而 代 之 ,在 Music Beta WHP, BBC 正 从 外 部 网 站 (诸如 MusicBrainz fil 
维基 百科 ) 引入 信息 ， 并 将 这 些 信 息 集成 进 他 们 的 网 页 中 。 

为 此 ，BBC 已 经 采用 了 RDF 标准 ， 并 已 经 将 它 自 己 的 数据 模式 与 MusicBrainz 发 布 的 数 
据 模式 建立 了 映射 ， 以 利用 MusicBrainz 提供 的 唯一 标识 符 。 这 将 允许 BBC 网 站 利用 公开 领 
域 的 内 容 ， 扩 充 在 那 找到 的 档案 网 页 。MusicBrainz 是 一 个 开放 内 容 音 乐 “元 数据 库 "， 列 出 
了 超过 40 万 个 艺术 家 的 信息 ; 维基 百科 网 页 上 的 信息 盒 ( info-box) 中 包含 的 信息 被 DBpedia 
所 捕获 。 


6.2.2 #6) 


作为 一 个 例子 ， 我 们 看 一 看 John Lennon 的 BBC Artist 网 页 9。 初 看 起 来 ， 这 个 网 页 像 一 
个 普通 的 带 有 诸如 传记 信息 、 专 业 信息 的 艺术 家 信息 的 网 页 ， 例 如 John Lennon 合作 过 的 艺术 
家 、 他 加 入 过 的 乐队 、 专 辑 的 评论 ， 等 等 。 但 这 个 网 页 也 是 一 个 丰富 的 RDF 三 元 组 集 ， 使 用 
John Lennon 在 MusicBrainz 的 标识 符 4d5447da7 作为 一 个 资源 来 表述 这 样 的 信息 : 


5c014631#artist foaf:name "John Lennon" 


4d5447d7#artist bio:event _ :nodel5vknin3hx2 
_ :nodel5vknin3hx2 rdf:type bio:Death 
_:nodel5vknin3hx2 bio:date "1980-12-08" 


4d5447d7#artist foaf:made _:nodel5vknin3hx7 
_:nodel5vknin3hx7 dc:title "John Lennon/Plastic Ono Band" 


4d5447d7#artist owl:sameAs dbpedia:John Lennon 


其 表述 了 一 个 叫做 John Lennon 的 艺术 家 死 于 1980 年 12 月 12 日， 他 录制 了 一 张 叫做 
“John Lennon/Plastic Ono Band” 的 唱片 ， 并 且 他 也 被 dbpedia:John_Lennon 这 个 URI 
标识 。 

BBC Artist 关于 John Lennon 的 网 页 的 完整 内 容 包含 60 个 三 元 组 ， 基 于 此 并 使 用 描述 家 
庭 关 系 、 音 乐 领域 、 时 间 和 日 期 、 地 理 信息 、 社 交 关 系 等 40 个 不 同 的 本 体 可 以 推理 出 另外 
300 个 三 元 组 。 

完整 的 网 站 包含 大 约 40 万 个 艺术 家 网 页 、16 万 个 外 部 链接 和 10 万 条 艺术 家 到 艺术 家 的 
关系 。 

语义 网 技术 的 使 用 ， 例 如 使 用 URI 作为 标识 符 并 将 其 与 外 部 语义 数据 提供 者 配 准 ， 意 味 
着 网 页 的 创建 和 维护 所 需要 的 人 力 只 是 过 去 的 一 小 部 分 。 有 趣 的 是 ，BBC 不 仅 消 费 了 这 样 的 
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信息 资源 ， 也 将 它们 回馈 给 全 世界 。 简 单 地 将 rdf 添加 到 任何 一 个 BBC Artist 网 页 的 URI, 
实际 上 将 会 提供 这 个 网 页 所 基于 的 RDF 数据 。 通 过 以 这 种 方式 发 布 RDF，BBC 正在 将 他 们 
的 数据 提供 给 想 要 使 用 它 的 第 三 方 。 

当然 ， 当 使 用 公开 信息 作为 输入 时 ， 总 是 面临 信息 包含 错误 这 样 的 风险 。 在 这 种 情况 下 ， 
BBC 没有 内 部 修复 那些 错误 。 相 反 地 ， 他 们 会 在 诸如 MusicBrainz 和 DBpedia 等 外 部 来 源 上 
修复 错误 。 这 不 仅 同时 修复 了 BBC 网 站 上 的 错误 ， 也 为 这 些 数 据 源 的 任何 其 他 用 户 修复 了 错 
误 ， 因 此 为 提升 可 公开 获得 的 数据 源 的 质量 做 出 了 贡献 。 


6.2.3 ”运用 


BBC Artist 项 目 是 “BBC 推进 的 ， 从 在 多 种 遗留 内 容 生 产 系 统 中 构建 的 网 页 向 事实 上 发 
布 那些 我 们 可 以 在 整个 万 维 网 上 用 一 种 更 动态 的 方式 使 用 的 数据 进行 迁移 的 一 个 普遍 运动 中 
的 一 部 分 ”。BBC 正 将 他 们 网 站 的 其 他 部 分 构建 于 包含 节目 信息 9 的 链接 数据 标准 和 资源 ， 包 
括 节目 的 URI 和 使 用 BBC 的 节目 本 体 S 以 及 来 源 于 BBC 的 使 用 了 其 自己 的 WildLife 本 体 有 的 
广泛 的 高 质量 的 自然 节目 的 野生 动物 信息 。 


6.3 BBC 世界 杯 2010 网 站 


6.3.1 背景 


除了 广播 电台 和 电视 节目 以 外 ，BBC 将 大 量 的 努力 用 于 构建 网 站 来 提供 新 闻 和 媒体 信息 。 
在 他 们 的 2010 世界 杯 足球 赛 网 站 上 ，BBC 部 署 了 语义 技术 来 获得 更 加 自动 的 内 容 发 布 、 更 
多 可 以 通过 更 少 人 力 来 管理 的 网 页 、 语 义 导 航 和 个 性 化 。 


6.3.2 Pl 

一 个 典型 的 运动 员 的 网 页 类 似 于 图 6-2 8。 类 似 的 网 页 还 有 几 百 个 运动 员 、 几 十 支队 伍 、 
所 有 的 分 组 、 所 有 的 比赛 ， 等 等 ， 当 然 所 有 这 些 都 是 高 度 相 连 的 。 

BBC 已 经 开发 了 一 些小 本 体 来 捕获 足球 领域 ， 包 括 特定 领域 的 关于 足球 队 和 锦标 赛 
的 概念 ， 以 及 使 用 诸如 FOAF @ 和 GeoNames @ 等 知名 本 体 的 关于 事件 和 地 理 位 置 的 宽泛 

图 6-3 展现 了 一 个 小 的 BBC 世界 杯 本 体 的 例子 。 这 些 本 体 被 用 于 推出 额外 的 信息 以 显示 
给 用 户 ， 例 如 一 个 运动 员 参 与 的 国内 比赛 以 及 运动 员 所 属 的 球 队 。 


http://www.bbc.co.uk/programmes. 

http://www. bbc.co.uk/ontologies/programmes/2009-09-07.shtml. 
http://www.bbc.co.uk/ontologies/wildlife/2010-02-22.shtml, 
http://news.bbc.co.uk/sport/football/world_cup_2010/groups_and_teams/team/england/wayne_rooney. 
http://xmIns.com/foaf/spec/ 

http://www.geonames.org/ s 
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Latest matches 


URU 2-3 NED 





BB Highiights & report 


GER 0-1 ESP 





DB Highlights & report 





URU 2-3 GER 


E Highlights & report 





NED 0-1 ESP 
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| H= Wayne Rooney 





Position: Striker 
Squad number: 10 
|| Date of birth 24 October, 1985 (24 years old) 
Height: 5'10" (178cm) 
| Tournament totals 





Shots on target | off target 





Goals Assists 





| 
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图 6-2 BBC 世界 杯 网 站 的 典型 网 页 























































































































图 6-3 BBC 体育 锦标 赛 本 体 的 一 部 分 
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6.3.3 ”运用 


运转 BBC 世界 杯 网 站 的 系统 采用 一 个 经 典 的 三 层 体系 结构 ， 其 中 Ci) 所 有 信息 存储 在 一 
个 RDF 三 元 组 存储 库 中 ，(ii) 这 个 三 元 组 存储 库 按 一 些 本 体 来 组 织 ， 支 持 三 元 组 存储 库 的 查 
i, VAR Citi) 一 个 用 户 界面 层 使 用 基于 本 体 的 三 元 组 存储 库 查询 来 获得 信息 并 呈现 给 用 户 。 

有 了 这 个 发 布 模型 ， BBC 声称 已 经 极 大 地 增加 了 他 们 的 内 容重 用 及 赋予 新 用 途 的 机 会 ， 
降低 了 需要 维护 网 站 的 记者 人 数 ， 并 通过 语义 驱动 的 网 页 布局 和 多 维 入 口 〈 运 动员 、 比 赛 、 
分 组 等 ) 提升 了 用 户 体验 。 

在 其 高 峰 期 ， 系 统 由 一 家 商业 三 元 组 存储 库 供应 商 运行 ， 其 每 分 钟 处 理 一 千 条 SPARQL 
查询 (相当 于 每 天 一 百 万 条 查询 )、 每 分 钟 几 百 条 RDF 语句 的 插入 或 更 新 以 及 使 用 完整 的 
OWL 推理 。 

BBC 正 计 划 将 相同 的 方法 运用 于 他 们 的 奥林匹克 2012 网 站 ， 其 将 会 覆盖 来 自 超过 200 
个 国家 的 超过 10 000 个 运动 员 ， 对 每 个 项 目 和 每 个 事件 都 有 网 页 ， 呈 现 几乎 实时 的 统计 数据 
并 提供 58 000 小 时 的 视频 内 容 。 图 6-4 展现 了 BBC 正在 开发 的 通用 体育 本 体 的 一 小 部 分 。 











































































































































































































































































































图 6-4 BBC 奥林匹克 本 体 的 一 部 分 


6.4 政府 数据 


6.4.1 SR 

语义 网 技术 早期 在 世界 上 的 一 些 大 规模 运用 是 奥巴马 政府 推动 的 政府 透明 化 的 成 果 。 将 
过 去 传统 上 封锁 在 政府 机 构 内 部 而 不 对 公众 公开 的 数据 源 发 布 出 来 ， 这 被 视 为 面向 更 透明 政 
府 的 一 项 关键 步骤， 语义 网 技术 被 认为 是 发 布 这 些 数据 的 一 项 关键 技术 。 如 http://data.gov 等 
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网 站 目前 已 经 发 布 了 来 自 250 个 不 同 的 政府 机 构 的 250 000 个 数据 集 ， 涉 及 经 济 指标 、 医 疗 
服务 统计 数据 ， 甚 至 环境 数据 。 并 非 所 有 (或 者 甚至 不 是 太 多 的 ) 数据 都 完全 是 链接 数据 的 格 
式 ， 都 采用 RDF、URI、 本 体 ， 或 都 链接 到 其 他 数据 集 。 在 这 种 情况 下 ， 就 可 以 考虑 W3C 引 
入 的 刻画 了 从 很 简单 的 技术 直到 发 布 链接 数据 的 五 星 ( 5-star) 标准 。 简 言 之 : 

女 以 任何 格式 、 在 任何 地 方 都 将 数据 发 布 在 网 上 。 例 如 ,仅仅 将 带 有 表格 (甚至 是 扫描 
的 文档 ) 的 PDF 文档 放 在 某 个 网 站 上 就 可 以 在 发 布 数据 方面 评 为 1 颗 星 。 尽 管 技术 上 很 平凡 ， 
在 实际 中 这 已 经 意味 着 克服 了 社会 、 组 织 和 官僚 式 的 阻碍 。 

女友 使 用 一 种 机 器 可 读 的 格式 。 这 意味 着 避免 诸如 PDF 文档 等 格式 。 发 布 Excel 电子 表 
格 是 最 典型 的 数据 发 布 为 2 颗 星 的 例子 。 

妇女 女 使 用 一 种 开放 的 格式 。 这 意味 着 避免 Excel 等 专 有 格式 ， 而 是 使 用 诸如 .csv 文件 
或 Open Office 格式 等 开放 的 格式 。 典 型 的 简单 格式 转换 就 足以 使 评级 从 2 颗 星 变 为 3 颗 星 。 

龙 码 友 友 为 每 个 数据 项 分 配 一 个 URL。 这 是 万 维 网 语义 轿 露 头角 的 第 一 步 : 为 每 个 数据 
类 型 、 数 据 项 和 数据 属性 都 给 予 一 个 URI 来 指称 。 这 允许 其 他 人 链接 到 这 个 发 布 的 数据 集 。 

妇女 友 友 码 最 后 ， 链 到 共享 的 词汇 表 。 例 如 ， 当 讨论 所 有 城市 的 类 时 使 用 DBpedia 的 城 
市 词汇 ， 以 及 类 似 的 关于 实体 名 称 和 属性 的 词汇 。 这 样 使 用 外 部 词汇 表 真 正 实现 了 跨越 不 同 
网 站 的 数据 集 的 互 链 。 


6.4.2 ”运用 


尽管 http://data.gov 上 的 大 量 数据 已 经 (并 且 仍 然 ) 仅仅 是 2 颗 星 格式 ， 事 实 上 提升 这 
些 数据 在 上 述评 级 系统 中 的 位 置 并 不 困难 。 在 8 个 月 时 间 内 ， 伦 斯 勒 理 工学 院 (Rensselaer 
Polytechnic Institute) 的 学 生 们 设法 让 http://data.gov 的 64 亿 条 数据 项 “万 维 网 化 ”了 ， 更 重 
要 的 是 ， 他 们 为 这 些 多 样 的 项 目 创建 了 应 用 ， 例 如 绘制 邮政 服务 开支 和 表现 的 关系 图 ,绘制 
荒野 火灾 和 机 构 预 算 的 关系 图 (以 度量 其 效率 )， 用 税务 表格 上 的 信息 来 覆盖 州 际 迁移 ， 绘 制 
家 庭 收 入 和 医疗 索赔 的 关系 图 ， 比 较 3 个 公开 预算 数据 集中 的 机 构 预算 ， 以 及 绘制 参观 了 和 白 
富 的 人 们 的 社交 网 络 。 尽 管 不 可 能 去 建立 因果 关系 ， 但 据 报 道 ， 公 民 根 据 信息 自由 法 案 的 申 
诉 数量 从 http://data.gov 运行 起 已 经 大 幅 下 降 。 

受 这 一 成 功 的 鼓舞 ， 其 他 政府 已 经 开始 效仿 这 个 样 例 ， 包 括 了 美国 许多 州 和 大 城市 的 政 
府 ， 以 及 加 拿 大 、 爱 尔 兰 、 挪 威 、 澳 大 利 亚 和 新 西 兰 等 国家 ， 而 在 法 国 、 意 大 利 、 丹 麦 、 奥 
地 利 、 德 国 和 许多 其 他 国家 也 已 经 发 起 了 公民 倡议 。 也 许 最 重要 的 举措 已 经 在 英国 出 现 ， 
http://data.gov.uk 已 经 受到 了 来 自 政府 的 强烈 支持 ， 其 不 仅 被 视 为 迈 向 更 透明 政府 的 一 个 步 
又 ,也 是 一 个 降低 成 本 的 机 制 。 不 再 去 构建 和 维护 昂贵 的 带 有 政府 信息 的 网 站 ， 政 府 简 单 地 
发 布 底层 的 数据 源 并 鼓励 第 三 方 (或 者 是 公民 或 者 是 商业 机 构 ) 基于 这 些 发 布 的 数据 源 开 发 服 
务 。 据 报道 ， 仅 仅 在 美国 ， 第 三 方 已 经 构建 了 超过 200 个 应 用 。 世 界 范围 内 这 样 的 显著 应 用 
包括 一 个 自行 车 路 线 的 安全 地 图 、 购 房 者 关于 他 们 新 邻居 的 信息 、 一 个 学 校 查找 器 、 一 个 托 


， 儿 所 查找 器 、 污 染 警告 、 一 张 区 域 性 支出 地 图 和 WhereDidMyTaxGo e。 


© http://www.wheredidmytaxgo.co.uk/。 





最 后 ， 政 府 间 组 织 正 沿 着 同样 的 道路 前 进 ， 例 如 世界 银行 ( http://data.worldbank.org)、 欧 
盟 的 欧洲 招标 程序 网 站 (http:Wted.europa.eu) 和 欧洲 统计 办 公 室 Eurostat ( http://ec.europa.eu/ 


eurostat/ ) 。 


6.5 《纽约 时 报 》 

从 1913 年 起 , 《纽约 时 报 》New York Times) 已 经 维护 了 一 个 它 所 出 版 的 所 有 主题 的 索引 。 
这 已 经 增长 成 为 一 个 包含 大 约 30 000 个 “主题 标题 ”的 集合 ， 描 述 了 人 位置、 人物、 组 织 和 事 
件 .《 纽 约 时 报 》 从 1851 年 第 一 次 问世 起 的 每 篇 文章 都 已 经 被 标注 了 这 些 主题 标题 ， 这 样 的 
标签 被 用 来 提供 新 闻 提 醒 服 务 ， 以 自动 化 编辑 过 程 ， 并 构建 “主题 网 页 ”来 收集 关于 一 个 给 
定 主题 的 所 有 《纽约 时 报 》 的 信息 。 

2009 年 ,《 纽 约 时 报 》 开 始 将 其 整个 主题 标题 索引 转换 为 语义 网 格式 。 不 仅 整 个 标题 列 
RA RDF 格式 发 布 ， 其 词汇 也 已 经 被 链 到 了 链接 数据 万 维 网 上 的 中 心 节点 ， 例 如 DBpedia, 
Freebase 和 GeoNames。 截 至 2010 年 ， 大 约 30% 的 主题 标题 已 经 完成 这 个 过 程 。 

《纽约 时 报 》 已 经 报告 说 他 们 的 主题 标题 与 链接 数据 万 维 网 的 链接 帮助 他 们 提供 了 地 理 信 
A (通过 与 GeoNames 的 链接 )， 帮 助 他 们 将 文章 与 其 他 那些 诸如 美国 国会 图 书馆 等 经 常 被 报 
纸 使 用 的 数据 集 配 准 ， 并 使 得 快速 构建 他 们 存档 材料 的 非 标准 融合 成 为 可 能 ， 例 如 找到 关于 
一 所 给 定 大 学 校友 录 的 所 有 条 目 。 


6.6 Sig.ma 和 Sindice 


尽管 诸如 GoodRelations 等 应 用 帮助 传统 搜索 引擎 改进 了 他 们 的 结果 而 又 不 曾 让 终端 用 户 
面 对 底 层 的 RDF 图 ， 搜 索引 擎 Sindice S 和 它 的 前 端 Sig.ma 9 与 之 不 同 : Sindice 直接 操作 构 
成 整个 语义 网 的 RDF 图 ， 而 Sig.ma 向 用 户 旦 现 以 这 种 方式 发 现 的 二 元 关系 。 

Sindice 有 一 个 经 典 的 搜索 引擎 体系 结构 : 一 个 候 虫 、 一 个 非常 大 的 索引 的 存储 库 和 一 个 
检索 界面 。 但 区 别 于 一 个 经 典 搜索 引擎 的 是 ，Sindice 并 不 检索 和 索引 词 和 词组 ， 而 是 检索 和 
索引 RDF 图 。 在 本 书写 作 时 ,Sindice 索引 了 4 亿 个 RDF “文档 "， 得 到 了 120 亿 条 RDF 语句 。 
这 些 语句 被 索引 并 可 以 通过 一 个 SPARQL 端点 查询 。 这 形成 了 一 种 类 似 数据 库 的 数据 之 网 的 
存 取 ， 可 以 被 开发 者 和 商家 使 用 以 增强 其 产品 和 服务 。 有 趣 的 是 ，Sindice 爬虫 并 不 限于 疏 取 
RDF 图 ， 也 疏 取 其 他 形式 的 结构 化 数据 ， 例 如 使 用 HTMLS5 微 数据 格式 、Schema.org 词汇 表 
或 其 他 微 格式 。 

Sig.ma 是 一 个 用 户 界 面 ， 用 来 演示 数据 万 维 网 上 的 在 线 查 询 。 始 于 关键 词 搜索 ，Sig.ma 
识别 出 数据 万 维 网 上 的 与 一 个 关键 词 相 关 的 那些 URL, .并 找到 所 有 描述 这 些 URL 的 三 元 组 。 
通过 一 个 交互 式 用 户 界 面 ， 用 户 可 以 调研 哪些 三 元 组 源 自 哪些 数据 源 ， 选 择 或 删除 特定 的 数 
据 源 ， 通 过 点 击 给 出 的 与 搜索 词 相关 的 那些 URL“ 在 图 中 漫步 "， 并 打开 与 它们 相关 的 URL, 
等 等 。 


© http://sindice.com, 
© http://sig.ma。 
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通过 使 用 Sindice 搜索 引擎 ，Sig.ma 向 用 户 提供 了 一 个 关于 “数据 之 网 ”上 任意 给 定 主题 
的 在 线 视图 。 因 为 其 巧妙 的 用 户 界 面 和 Sindice 非常 完备 的 数据 库 ，Sig.ma 很 可 能 是 普通 用 户 
体验 当前 数据 万 维 网 的 结构 和 规模 及 其 已 经 捕获 的 纯 量 知识 的 最 佳 场所 。 


6.7 OpenCalais 


通讯 社 汤普森 路 透 社 (Thompson Reuters) 每 天 生产 几 生 条 新 闻 ， 广 泛 涉及 科学 、 商 业 、 
政治 和 体育 。 虽 然 新 闻 条 目 刚 开始 是 为 了 给 人 阅读 的 ， 但 是 路 透 社 的 一 个 重要 发 现 是 他 们 新 
闻 条 目的 大 量 消费 者 不 再 是 人 ， 而 是 计算 机 。 计 算 机 正在 阅读 从 路 透 社 流出 的 新 闻 ， 分 析 它 
并 产生 摘要 ， 读 取 列 表 、 金 融 投 资 建议 等 。 

这 导致 一 个 自 相 矛盾 的 情况 ， 计 算 机 为 计算 机 生产 信息 ,， 却 使 用 无 结构 的 自然 语言 作为 
一 种 相当 不 合适 的 通信 媒介 。 路 透 社 的 OpenCalais 服务 用 来 帮助 计算 机 处 理 以 自然 语言 文本 
形式 捕获 的 数据 。 它 分 析 一 段 文本 ， 识 别 出 诸 如 人 、 位 置 、 公 司 等 命名 实体 ， 并 用 RDF 标注 
文本 来 标识 这 些 命名 实体 。 

作为 一 个 简单 的 例子 ， 以 下 文本 产生 了 如 图 6-5 所 示 的 实体 和 关系 。 








图 6-5 OpenCalais 识别 出 的 对 象 和 关系 


After studying mathematics and computer science in Amsterdam, Frank van Harmelen moved 
to the Department of AI of the University of Edinburgh. While in Edinburgh, he worked with Prof. 
Alan Bundy on proof planning for inductive theorem proving. After his PhD research, he moved 
back to Amsterdam where he worked from 1990 to 1995 in the SWI Department under Prof. Bob 
Wielinga. In 1995 he joined the AI research group at the VrijeUniversiteit Amsterdam. 

对 于 这 些 对 象 ， 路 透 社 使 用 它 自己 的 URI 来 标识 实体 ， 但 大 量 这 些 私 有 的 URI 通过 
owl:sameAs 声明 链 到 相同 实体 的 那些 取 自 GeoNames、DBpedia、Freebase、 互 联网 电影 数 
据 库 等 的 更 为 广泛 使 用 的 URI。 这 允许 我 们 进一步 检索 关于 这 些 来 自 路 透 社 数据 库 的 实体 
的 信息 ， 例 如 财务 信息 、 董 事 会 成 员 的 姓名 等 。 因 此 ， 通 过 OpenCalais， 有 可 能 从 一 个 提 
及 词汇 的 自然 语言 文本 迁移 到 一 个 结构 化 信息 项 的 万 维 网 。 据 报道 ，2011 年 Calais 每 天 能 





处 理 5 百 万 个 文档 。 


6.8 Schema.org 


Schema.org 是 一 项 搜索 引擎 提供 商 (Google, Yahoo, Microsoft, Yandex) 鼓励 语义 标记 
网 页 的 努力 。 它 的 鼓励 方式 是 定义 一 个 在 Schema.org 可 以 获得 的 公共 模式 或 词汇 表 。 这 个 词 
汇 表 覆盖 了 人 们 搜索 的 常见 事物 ， 如 产品 、 工 作 和 事件 。 通 过 使 用 一 个 公共 词汇 表 ， 搜 索引 
擎 能 够 更 好 地 索引 网 页 ， 并 在 搜索 结果 中 展现 更 丰富 的 信息 。 

Schema.org 同时 支持 微 数据 和 RDFa 1.1 Lite 形式 的 标记 。 因 此 ， 可 以 将 Schema.org 词汇 
表 与 万 维 网 上 的 其 他 词汇 表 混 合 起 来 ， 例 如 之 前 讨论 过 的 GoodRelations 本 体 。Schema.org 展 
现 了 应 用 如 何 得 以 推动 机 器 可 理解 的 标记 的 运用 。 


6.9 小结 


语义 网 技术 正 被 各 式 各 样 的 应 用 所 使 用 ， 从 支撑 网 站 到 让 搜索 引擎 更 容易 地 理解 网 页 的 
内 容 。 所 有 这 些 应 用 中 的 一 个 关键 思想 是 ， 公 共 的 本 体 为 集成 和 理解 来 自 多 个 来 源 的 知识 提 
供 了 一 个 基础 。 我 们 仅仅 强调 了 一 些 主要 的 语义 网 应 用 ， 每 天 还 有 无 数 更 多 的 应 用 正在 被 使 
用 。 我 们 鼓励 读者 去 调研 和 理解 其 他 正在 被 实现 的 应 用 。 
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本 体 工 程 


7.1 引言 

到 目前 为 止 ， 我 们 主要 关注 对 于 语义 网 至 关 重要 的 技术 : 表示 语言 、 查 询 语言 、 转 换 和 
推理 技术 ， 以 及 工具 。 显 然 ， 介 绍 如 此 多 的 新 工具 和 技术 也 引发 了 方法 论 问题 : 这些 工具 和 
技术 如 何 才能 被 最 好 地 应 用 ? 在 什么 场景 下 应 该 使 用 何 种 语言 和 工具 ， 以 什么 顺序 使 用 ? 质 
量 控 制 和 资源 管理 的 问题 如 何 解 决 ? 


语义 网 中 的 许多 问题 已 经 在 其 他 环境 中 被 研究 过 一 一 例如 ， 在 软件 工程 、 面 向 对 象 设计 
和 知识 工程 中 。 全 面 介绍 所 有 这 些 内 容 已 经 超出 了 本 书 的 范围 。 然 而 在 本 章 中 ， 我 们 主要 探 
讨 在 构建 本 体 过 程 中 的 一 些 方法 论 问题 ， 特 别 是 手工 构建 本 体 (7.2 节 )、 本 体 复 用 (7.3 节 ) 
和 使 用 半自动 化 方法 (7.4 节 )。7.5 节 介 绍 本 体 映 射 。7.6 节 介 绍 如 何 从 关系 数据 库 中 发 布 本 
体 实例 。 最 后 ，7.7 节 解 释 语义 网 技术 如 何 能 被 集成 到 单个 体系 结构 中 来 构建 应 用 。 


7.2 手工 构建 本 体 

对 于 我 们 探讨 的 本 体 的 手工 构建 ， 我们 主要 参考 Noy All McGuinness 的 《 Ontology 
Development 101: A Guide to Creating Your First Ontology 》 教 程 。 更 多 的 参考 文献 请 见 建议 
阅读 。 

我 们 在 本 体 开 发 过 程 中 区 分 以 下 主要 阶段 。 


1 ) 确定 范围 。 5) 定义 属性 。 
2 ) 考虑 复 用 。 6 ) 定义 刻 面 。 
3 ) 枚 举 术语 。 7 ) 定义 实例 。 
4) 定义 分 类 。 8 ) 检测 异常 。 


和 任何 开发 过 程 类 似 ， 在 实践 中 这 个 过 程 并 不 是 线性 的 。 这 些 步骤 将 不 得 不 迭代 ， 在 开 
发 过 程 中 的 任何 时 间 点 上 都 可 能 需要 回溯 到 更 早 的 阶段 。 我 们 将 不 讨论 复杂 的 过 程 管理 ， 而 
是 介绍 单个 步骤 。 

7.2.1 确定 范围 
开发 一 个 领域 本 体 本 身 不 是 目的 。 开 发 一 个 本 体 类 似 于 定义 一 组 被 其 他 程序 所 使 用 的 数 
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据 和 结构 。 换 句 话 说， 一 个 本 体 是 一 个 特定 领域 的 模型 (model)， 为 特殊 目的 而 构建 。 作 为 结 
果 ， 对 一 个 具体 领域 而 言 不 存在 正确 的 本 体 。 一 个 本 体 必然 是 一 个 特定 领域 的 抽象 ， 因 此 总 
是 存在 可 行 的 代替 品 。 什 么 被 包含 在 抽象 中 应 该 由 将 会 使 用 的 本 体 和 已 经 期 望 的 未 来 扩展 所 
决定 。 这 个 阶段 将 要 回答 的 基本 问题 是 : 这 个 本 体 将 涵盖 什么 领域 ? 我 们 出 于 什么 原因 使 用 
这 个 本 体 ? 这 个 本 体 应 该 回答 什么 样 的 问题 ? 谁 将 使 用 和 维护 这 个 本 体 ? 
7.2.2 ”考虑 复 用 

伴随 着 语义 网 被 广泛 部 署 ， 许 多 本 体 ， 尤 其 在 公共 领域 (社交 网 络 、 医 学 、 地 理 )， 已 经 


公共 领 
可 用 。 因 此 ， 我 们 很 少 需要 自己 从 头 定义 本 体 。 几 乎 总 是 存在 一 个 可 用 的 第 三 方 本 体 ， 至 少 
可 以 为 我 们 自己 的 本 体 提 供 一 个 有 用 的 起 点 ( 见 7.3 节 )。 


\ 共 人 
总 
) 


7.2.3 MEARS 

在 实际 定义 一 个 本 体 的 过 程 中 ， 第 一 步 是 写 下 一 个 所 有 相关 术语 的 非 结 构 化 列表 ， 期 望 
这 些 术 语 在 本 体 中 出 现 。 通 常 ， 名 词 构成 类 名 的 基础 ， 而 动词 (或 动词 短语 ) 构成 属性 名 的 基 
础 (例如 ,is part of has component). 

传统 的 知识 工程 工具 ， 例 如 梯形 和 格 分 析 ， 可 以 被 有 效 地 用 于 本 步 又， 用 来 获得 术语 集 
合 及 这 些 术语 的 初始 结构 。 


7.24 定义 分 类 

在 识别 相关 术语 后 ， 这 些 术 语 必须 被 组 织 成 一 个 分 类 层次 。 对 于 采用 自 项 向 下 还 是 自 底 
向 上 的 方法 哪 种 更 有 效 /更 可 靠 会 存在 分 歧 。 

当然 ， 很 重要 的 一 点 是 确保 层次 确实 是 一 个 分 类 ( 子 类 ) 层次 。 换 句 话 说 ,如果 A 是 B 
的 一 个 子 类 ,那么 A 中 的 每 个 实例 都 必须 是 B 的 实例 。 只 有 这 样 才能 确保 我 们 遵循 了 诸如 
rdfs:subClassOf 的 原 语 的 内 置 语义 。 


7.2.5 ”定义 属性 

这 一 步骤 通常 和 之 前 的 步骤 交错 : 在 组 织 类 层次 的 过 程 中 ， 组 织 链 到 类 的 属性 很 自然 。 

记得 subclassof 关系 的 语义 要 求 当 A 是 B 的 一 个 子 类 时 ， 每 个 B 的 实例 所 拥有 的 属 
性 声明 也 必须 适用 于 A 的 实例 。 由 于 继承 ， 将 属性 关联 到 在 它 可 用 的 层次 中 最 高 层次 的 类 上 
很 有 意义 。 

在 将 属性 关联 到 类 时 ， 立 即 为 这 些 属 性 提供 定义 域 和 值 域 声明 也 很 有 意义 。 在 一 般 化 和 特 
殊 化 之 间 存 在 一 个 方法 论 的 折 中 。 一 方面 ， 给 予 属 性 尽 可 能 通用 的 定义 域 和 值 域 很 具有 吸引 
力 ， 这 使 得 属性 可 以 被 子 类 (通过 继承 ) 使 用 。 另 一 方面 ， 将 定义 域 和 值 域 定义 的 越 窄 越 有 用 ， 
使 得 我 们 可 以 通过 发 现 定 义 域 和 值 域 的 违约 情况 来 检测 本 体 中 潜在 的 不 一 致 性 和 错误 概念 。 


7.26 MAG 


在 所 有 这 些 步 又 之 后 ,该 本 体内 需要 RDF 模式 所 提供 的 表达 能 力 ， 而 没有 用 到 OWL 中 
任何 额外 的 原 语 ， 注 意 到 这 点 很 有 趣 。 这 将 在 本 阶段 中 改变 ， 本 阶段 将 用 刻 面 来 丰富 之 前 定 
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义 的 属性 。 

© 基数 。 为 越 多 越 好 的 属性 指出 它们 是 和 否 允 许 或 需要 拥有 特定 数目 的 不 同 取 值 。 经 常 出 
现 的 例子 是 “至 少 1 个 值 ”( 即 必要 属性 ) 和 “最 多 1 个 值 ”( 即 单 值 属性 )。 

。 需要 的 取 值 。 经 常 ， 借 助 某 个 属性 含有 特定 的 值 来 定义 类 ， 而 这 些 所 需 取 值 可 以 在 
OWL 中 使 用 owl:hasValue 指定 。 有 时 要 求 没 有 这 人 么 严格 : 一 个 属性 被 要 求 有 某 些 
取 值 来 源 于 一 个 给 定 的 类 (而 不 必 是 一 个 特定 的 值 ， 即 owl: someValuesFrom). 

。 关系 特征 。 刻 面 的 最 后 一 类 关注 属性 的 关系 特征 : 对 称 性 、 传 递 性 、 互 逆 属 性 和 函数 
型 取 值 。 

在 本 体 构建 过 程 中 完成 这 一 步 之 后 ， 可 以 检查 本 体内 部 是 否 有 不 一 致 性 。( 在 这 步 之 前 是 
不 可 以 的 ， 仅 仅 是 因为 RDF 模式 还 没有 丰富 到 能 够 表达 不 一 致 性 。) 经 常 发 生 不 一 致 性 的 例 
子 包 括 对 于 传递 的 、 对 称 的 或 互 逆 的 属性 的 定义 域 和 值 域 定 义 不 兼 容 。 类 似 地 ， 基 数 属性 经 
常 是 不 一 致 性 的 来 源 。 最 后 ， 对 于 属性 取 值 的 要 求 可 能 会 与 定义 域 和 值 域 限制 冲突 ， 这 给 出 
了 另 一 种 可 能 的 不 一 致 性 的 来 源 。 


7.2.7 ”定义 实例 

当然 ,我 们 很 少 为 本 体 自 身 而 定义 本 体 。 相 反 地 ， 我们 使 用 本 体 来 组 织 一 组 实例 ， 
而 为 本 体 添 加 这 些 实例 是 一 个 独立 的 步骤 。 通 常 ， 实 例 的 数目 可 能 超越 本 体 中 类 的 数目 
几 个 数量 级 。 本 体 中 类 的 数目 从 几 百 个 到 数 万 个 ， 而 实例 的 数目 从 几 百 个 到 数 十 万 个 ， 
其 至 更 多 。 

因为 如 此 巨大 的 数目 ， 为 本 体 发 布 实例 通常 不 是 通过 手工 完成 。 实 例 经 常 从 遗留 数据 源 
中 获取 ， 例 如 7.6 节 中 将 介绍 的 数据 库 。 另 一 种 经 常 使 用 的 技术 是 从 文本 语料库 中 自动 抽取 


[97] 实例 。 


7.2.8 ”检测 异常 

使 用 OWL 而 非 RDF 模式 的 一 个 重要 优点 在 于 检测 本 体 自 身 存在 不 一 致 性 的 可 能 性 ,或 
者 检测 本 体 发 布 的 一 组 实例 的 不 一 致 性 的 可 能 性 。 经 常 发 生 不 一 致 性 的 例子 包括 对 于 传递 的 、 
对 称 的 或 互 道 的 属性 的 定义 域 和 值 域 定 义 不 兼 容 。 类 似 地 ， 基 数 属性 经 常 是 不 一 致 性 的 来 源 。 
最 后 ， 对 于 属性 取 值 的 要 求 可 能 会 与 定义 域 和 值 域 限制 冲突 ， 这 给 出 了 另 一 种 可 能 的 不 一 臻 
性 的 来 源 。 


7.3 复 用 已 有 本 体 
如 果 可 能 ， 应 该 从 一 个 已 有 的 本 体 开 始 。 现 已 存在 各 式 各 样 的 本 体 了 。 


7.3.1 专家 知识 的 编纂 
一 些 本 体 由 一 大 组 专家 耗费 许多 年 时 间 仔 细 构 建 而 成 。 医 学 领域 的 一 个 例子 是 美国 
国家 癌症 中 心 (National Cancer Institute) 的 癌症 本 体 9。 文 化 领域 中 的 例子 包括 Art and 


© http://www.mindswap.org/2003/CancerOntology/。 
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Architecture Thesaurus (ATT) 9S， 它 包 含 12.5 万 个 术语 ， 以 及 Union List of Artist Names 
(ULAN) 9， 它 包含 22 万 个 艺术 家 的 条 目 。 男 一 个 例子 是 描述 文化 图 片 的 Iconclass WEES, 
它 包含 2.8 万 个 术语 。 地 理 领 域 的 一 个 例子 是 Getty Thesaurus of Geographic Names (TGN) ®, 
它 包含 了 超过 1 百 万 个 条 目 。 


7.3.2 ”集成 的 词汇 表 

有 时 ， 尝 试 将 一 些 独立 开发 的 词汇 表 融 合成 单个 大 的 资源 。 最 好 的 一 个 例子 是 Unified 
Medical Language System @， 它 集成 了 100 个 生物 医学 词汇 表 和 分 类 。UMLS 元 词典 自身 包 
含 75 万 个 概念 ， 以 及 这 些 概 念 之 间 超 过 1 千 万 条 链接 。 并 不 让 人 感到 吃惊 的 是 ， 这 样 集 成 了 
许多 独立 开发 的 词汇 表 的 资源 的 语义 相对 较 弱 ， 但 是 不 可 否认 它 对 于 许多 应 用 而 言 是 有 用 的 ， 
至 少 可 以 作为 一 个 起 点 。 
7.3.3 FRAME 

之 前 介绍 的 本 体 都 是 高 度 领 域 相关 的 ， 有 一 些 尝试 试图 定义 非常 普遍 适用 的 本 体 (有 
时 称 为 上 层 本 体 )。 两 个 很 好 的 例子 是 Cyc@， 它 包含 了 6 于 个 概念 和 6 万 个 断言 ， 以 及 
Standard Upperlevel Ontology (SUO) ©. 
7.3.4 ”主题 层次 

严格 意义 上 说 ， 这 些 “ 本 体 ” 不 能 称 为 本 体 : 它们 是 术语 的 简单 集合 ， 被 松散 地 组 织 
成 一 个 特殊 化 层次 。 这 个 层次 通常 不 是 一 个 严格 的 分 类 ， 而 是 混合 了 不 同 的 特殊 化 关系 ， 
例如 is-a、part-of 或 contained-in。 然 而， 这 些 资源 经 常 可 以 用 作 一 个 起 点 。 一 个 大 规模 
的 例子 是 Open Directory 层次 8， 它 包含 超过 40 万 个 层次 化 组 织 的 类 别 并 且 以 RDF 格式 
发 布 。 


7.3.5 “语言 学 资源 


有 些 资源 起 初 并 不 是 为 抽象 一 个 领域 而 构建 的 ， 而 是 作为 该 领域 的 语言 学 资源 。 同 样 
地 ， 它 们 也 有 助 于 作为 本 体 开发 的 起 点 。 这 个 类 别 中 的 一 个 好 的 例子 是 WordNet@， 它 包含 
超过 9 万 个 词语 含义 的 定义 。 

7.3.6 ”百科 知识 


维基 百科 ， 依 靠 大 众生 成 的 百科 知识 ， 提 供 了 有 关 一 系列 主题 的 丰富 信息 。DBpedia 项 


http://www.getty.edu/research/tools/vocabulary/aat. 

http://www. getty.edu/research/conducting_research/vocabularies/ulan. 
http://www.iconclass.nl/. 

http://www. getty.edu/research/conducting_research/vocabularies/tgn. 
http://umlsinfo.nlm.nih.gov/. 

http://www.opencyc.org/. 

http://suo.ieee.org/ 

http://dmoz.org/. 

http://wordnet.princeton.edu/, RDF 格式 位 于 http://semanticweb.cs.vu.nl/lod/wn30/ 
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目 S 从 维基 百科 中 抽取 知识 ， 并 使 用 RDF A OWL 将 其 发 布 为 链接 数据 。 维 基 百 科 宽 泛 的 知 
识 使 得 DBpedia 网 站 成 为 构建 本 体 时 的 首要 参考 点 。Yago 9 是 利用 维基 百科 的 另 一 个 知识 库 ， 
但 是 它 还 包含 了 源 自 WordNet 和 诸如 GoeNames 9 的 地 理 资源 的 信息 。 


7.3.7 ”本体 库 


存在 一 些 在 线 的 本 体 库 。 例 子 包 括 TONES 本 体 库 咏 、BioPortal 8 以 及 由 Protégé 本 体 编辑 
器 8 提供 的 。 或 许 目前 最 好 的 在 线 本 体 库 是 Swoogle 9， 它 登记 了 超过 1 万 个 语义 网 文档 并 索 
引 它 们 的 类 、 属 性 和 实例 ， 以 及 它们 之 间 的 联系 。Swoogle 也 定义 了 一 个 语义 网 文档 的 排序 
属性 并 用 它 来 帮助 排序 搜索 结果 。 类 似 地 ，Sindice 3 搜索 索引 维护 了 一 个 几乎 包含 所 有 语义 
网 上 RDF 数据 的 索引 。Prefix.cc 8 列举 了 语义 网 上 最 常用 的 命名 空间 前 级 。 这 些 前 级 链 到 它 
们 所 代表 的 对 应 本 体 。 

在 很 少 一 些 情况 下 ， 现 有 本 体 可 以 不 加 修改 地 被 复 用 。 通 常 ， 现 有 概念 和 属性 必须 被 精 
化 (使 用 cowl:subclassof 和 owl:subProperty0f)。 男 外 ， 别 名 也 被 引入 以 更 好 地 适 
合 特定 领域 (Glo, EA owl:equivalentClass 和 owl:equivalentProperty)。 此 
Sb, RDF 和 OWL 提供 了 进一步 开发 本 体 的 机 会 ， 允 许 私自 修改 被 其 他 本 体 定义 的 类 。 

引入 本 体 和 建立 它们 之 间 映 射 的 主要 问题 还 待 研究 ， 这 被 认为 是 语义 网 研究 中 最 难 的 问 
题 之 一 。 


7.4 ”半自动 化 的 本 体 获取 

将 语义 网 的 愿景 变 为 现实 存在 两 个 核心 挑战 。 

首先 ， 为 构建 元 数据 之 网 ， 必 须 支 持 语 义 充实 的 再 工程 (reengineering) 任务 。 语 义 网 的 
成 功 主 要 依靠 本 体 和 关系 型 元 数据 的 增多 。 这 要 求 这 些 元 数据 能 够 被 高 速 且 低 成 本 地 生产 。 
为 实现 这 个 目标 ,通过 本 体 融 合 和 配 准 来 建立 语义 互 操 作 性 的 任务 可 能 需要 机 器 学 习 技 术 的 
支持 。 

其 次 ， 必 须 提供 一 种 维护 和 使 用 机 器 可 存 取 数据 的 方式 ， 这 是 语义 网 的 基础 。 因 此 ,我 
们 需要 能 够 支持 万 维 网 动态 性 的 机 制 。 

虽然 本 体 工 程 工具 已 经 在 过 去 的 10 ERAT, 手工 获取 本 体 依 然 是 一 个 耗 时 、 昂 贵 、 高 
技术 ， 甚 至 有 时 笨重 的 任务 ， 很 容易 导致 知识 获取 的 瓶颈 。 

这 些 问 题 类 似 过 去 的 20 年 知识 工程 师 遇 到 的 ， 他 们 研究 知识 获取 的 方法 学 或 定义 知识 库 


http://dbpedia.org。 

http://www.mpi-inf.mpg.de/yago-naga/yago/, 
http://www.geonames.org/. 
http://owl.cs.manchester.ac.uk/repository/browser . 

参见 http://bioportal.bioontology.org/. 

通过 http://protege.stanford.edu/download/ontologies.html! 访问 。 
http://swoogle.umbce.edu/. 

http://sindice.com. 
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的 工作 台 。 将 知识 获取 和 机 器 学 习 方 法 集成 已 被 证 明 对 知识 获取 有 益 。 

机 器 学 习 在 知识 获取 或 抽取 、 知 识 修正 或 维护 研究 领域 有 很 长 的 历史 了 ， 它 提供 了 一 大 
群 可 能 有 助 于 解决 问题 的 技术 。 下 面 这 些 任 务 可 以 通过 机 器 学 习 技 术 支 持 。 

© 从 万 维 网 上 已 有 的 数据 中 抽取 本 体 。 

。 从 万 维 网 上 已 有 的 数据 中 抽取 关系 数据 和 元 数据 。 

© 通过 分 析 概 念 的 外 延 来 融合 和 映射 本 体 。 

。 通过 分 析 实 例 数 据 来 维护 本 体 。 

。 通过 观察 用 户 来 改进 语义 网 应 用 。 

机 器 学 习 提供 了 一 组 技术 以 支持 下 面 的 任务 。 

。 RK. 

© 增 量 式 本 体 更 新 。 

。 对 知识 工程 师 的 支持 。 

。 改进 大 型 的 自然 语言 本 体 。 

。 纯 (领域 ) 本 体 学 习 。 

Omelayenko (参见 建议 阅读 ) 标识 了 下 面 3 种 类 型 的 本 体 ， 它 们 能 够 使 用 机 器 学 习 技术 
来 支持 。 


7.4.1 ”自然 语言 本 体 

自然 语言 本 体 (Natural Language Ontologies, NLO) 包含 语言 概念 之 间 的 词汇 关系 ， 它 们 
规模 很 大 并 且 不 需要 经 常 更 新 。 通 常 它们 代表 系统 的 后 台 知 识 ， 被 用 于 扩展 用 户 查 询 。NLO 
学 习 的 最 新 进展 看 上 去 非常 乐观 : 不 仅 存 在 一 个 稳定 的 通用 NLO， 而 且 还 有 自动 化 的 或 半 自 
动 化 的 领域 相关 NLO 的 构建 和 充实 技术 。 


7.4.2 ”领域 本 体 

领域 本 体 捕获 一 个 特定 领域 的 知识 ， 例 如 药理 学 或 打印 机 知识 。 这 些 本 体 在 一 个 受 限 领 
域 中 提供 了 对 领域 概念 的 详细 描述 。 通 常 ， 它 们 是 手工 构建 ， 但 是 不 同 的 学 习 技术 可 以 辅助 
(尤其 是 缺乏 经 验 的 ) 知识 工程 师 。 学 习 领 域 本 体 的 进展 没有 NLO 快 。 领 域 本 体 的 获取 依然 
需要 人 类 知识 工程 师 的 指导 ， 而 自动 化 的 学 习 技 术 在 知识 获取 过 程 中 只 起 到 很 小 的 作用 。 它 
们 只 能 在 领域 文本 中 发 现 统计 意义 上 可 验证 的 依赖 关系 ， 并 将 它们 建议 给 知识 工程 师 。 


7.4.3 “本体 实例 

本 体 实例 可 以 被 自动 化 地 生成 并 经 常 更 新 (例如 ， 黄 页 中 某 个 公司 的 信息 会 常 更 新 )， 而 
本 体 保持 不 变 。 本 体 实 例 的 学 习 任 务 非常 适合 机 器 学 习 的 框架 ， 并且 已 经 有 一 些 机 器 学 习 算 
法 的 成 功 应 用 。 但 是 这 些 应 用 要 不 就 是 严格 依赖 于 领域 本 体 ， 要 不 就 是 发 布 标 记 而 不 关联 到 
任何 领域 理论 。 对 于 给 定 一 个 领域 本 体 作为 输入 ， 一 种 从 文本 中 抽取 本 体 实例 的 通用 技术 还 
没有 被 开发 出 来 。 

除了 能 够 被 支持 的 本 体 的 不 同类 型 ， 本 体 学 习 中 也 存在 不 同 的 用 法 。 在 下 面 列表 中 ， 前 
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3 个 任务 〈 同 样 源 自 Omelayenko 的 研究 ) 涉及 知识 工程 中 的 本 体 获 取 任 务 ， 而 后 3 个 涉及 本 
体 维护 任务 。 

。 由 知识 工程 师 开 始 创建 本 体 。 在 这 个 任务 中 ， 机 器 学 习 通 过 建议 领域 中 最 重要 的 关系 
或 者 验证 构建 的 知识 库 来 辅助 知识 工程 师 。 
从 万 维 网 文档 中 抽取 本 体 模式 。 在 这 个 任务 中 ， 机 器 学 习 系 统 在 知识 工程 师 可 能 的 帮 
助 下 ， 以 数据 和 元 知识 (例如 元 本 体 ) 作为 输入 ， 并 生成 即刻 使 用 的 本 体 作 为 输出 。 
本 体 实 例 抽取 为 本 体 模式 填充 数据 ， 并 抽取 表示 在 万 维 网 文档 中 的 本 体 实 例 。 这 个 任 
务 和 信息 抽取 及 页 面 标注 类 似 ， 可 以 应 用 这 些 领 域 开 发 的 技术 。 
本 体 集成 和 浏览 处 理 重 构 与 浏览 大 型 的 、 可 能 机 器 可 学 习 的 知识 库 。 例 如 ， 这 个 任务 
可 能 将 机 器 学 习 器 的 命题 层次 知识 库 改 变 为 一 阶 逻 辑 知识 库 。 
本 体 维护 任务 更 新 本 体 的 某 些 部 分 ， 这 些 部 分 被 设计 为 能 更 新 的 〈 例 如 格式 化 那些 只 
能 在 页 面 布局 中 跟踪 修改 的 标签 ) 。 
本 体 扩 充 (或 本 体 调 谐 ) 将 微小 的 关系 的 自动 修改 加 入 已 有 本 体 。 这 不 改变 本 体 中 的 
主要 概念 和 结构 ， 但 是 会 使 得 本 体 更 加 精确 。 

机 器 学 习 领 域 已 有 各 种 各 样 的 技术 、 算 法 和 工具 。 但 是 ,本体 表示 的 一 个 重要 需求 是 本 
体 必 须 符 号 化 、 人 类 可 读 、 可 理解 。 这 使 得 我 们 只 涉及 产生 泛 化 的 符号 学 习 算 法 ， 而 跳 过 诸 
如 神经 网 络 、 遗 传 算法 之 类 的 其 他 方法 。 下 面 是 一 些 潜在 适用 的 算法 : 

。 命题 规则 学 习 算 法 学 习 关 联 规则 或 其 他 形式 的 属性 - 值 规则 。 

。 贝 叶 斯 学 习 的 最 佳 代表 是 朴素 贝 叶 斯 分 类 器 。 它 基于 贝 叶 斯 定理 ， 基 于 训练 实例 间 的 

属性 是 条 件 独 立 的 这 一 假设 ， 生 成 概率 性 的 属性 - 值 规则 。 

。 一 阶 逻 辑 规则 学 习 归 纳 出 包含 变量 的 规则 ， 称 为 一 阶 Horn 子 句 。 

© 聚 类 算法 使 用 基于 实例 的 属性 值 定义 的 相似 度 或 距离 度量 将 实例 聚 类 在 一 起 。 

总 之 ,我们 可 以 说 ,虽然 可 以 被 部 署 到 语义 网 工程 中 的 潜在 的 机 融 学 习 技 术 很 多 ,但 是 
这 个 领域 距离 完全 掌握 还 为 时 尚 早 。 


目 


7.5 ”本体 映射 


当 复 用 而 非 从 头 开 发 变 成 本 体 部 署 的 范式 ， 本 体 集 成 将 成 为 一 个 逐渐 棘手 的 任务 。 很 少 
205| 有 可 能 单个 本 体 可 以 完全 满足 一 个 特定 领域 的 需求 ， 更 多 情况 是 多 个 本 体 需要 被 组 合 。 这 导 
致 了 本 体 集成 问题 (也 称 为 本 体 配 准 或 本 体 映 射 )。 由 于 这 个 严峻 的 事实 ， 这 个 问题 近年 来 受 
到 研究 领域 的 广泛 关注 。 
当前 本 体 映 射 的 方法 包括 各 个 层次 的 不 同方 法 ,来 源 于 许多 不 同 领域 。 我 们 将 它们 分 为 
语言 学 的 、 统 计 的 、 结 构 的 和 逮 辑 的 方法 。 


7.5.1 ”语言 学 方法 


最 基本 的 方法 试图 利用 附着 于 源 本 体 和 目标 本 体 中 概念 上 的 语言 学 标签 来 发 现 潜在 的 匹 
配 。 简 单 的 方法 可 以 是 基本 的 提 词 干 技术 或 计算 汉 明 距离 ,或 者 也 可 以 使 用 特殊 的 领域 知识 。 


AALE 121 





后 者 的 一 个 例子 是 Diabetes Melitus type I Fil Diabetes Melitus type 1 不 是 一 个 可 以 忽略 的 小 差 
T, 但 是 它 却 具有 很 小 的 汉 明 距离 。 


7.5.2 ”统计 方法 

一 些 方法 不 使 用 概念 的 语言 学 标签 ， 而 是 使 用 实例 数据 来 确定 概念 间 的 对 应 。 如 果 源 本 
体 和 目标 本 体 中 的 概念 的 实例 存在 一 个 显著 的 统计 对 应 关系 ， 则 有 理由 相信 这 些 概念 是 ( 通 
过 一 个 包含 关系 或 者 甚至 可 能 是 等 价 关系 ) 强 关联 的 。 显 然 ， 这 些 方法 依赖 于 存在 一 个 足够 
大 的 被 源 本 体 和 目标 本 体 分 类 的 实例 库 。 


7.5.3 ”结构 方法 

因为 本 体 含 有 内 部 结构 ， 利 用 源 本 体 和 目标 本 体 的 图 结构 并 试图 确定 这 些 结构 间 的 相似 
度 是 可 行 的 ， 这 种 方法 常 与 其 他 方法 一 起 使 用 。 如 果 一 个 源 概念 和 一 个 目标 概念 有 相似 的 语 
言 学 标签 ， 则 它们 图 上 邻居 节点 的 不 相似 性 可 以 被 用 于 检测 同形 异 义 问题 ， 而 纯 语 言 学 方法 
可 能 会 错误 地 宣称 发 现 了 一 个 潜在 的 映射 。 


7.5.4 ”逻辑 方法 


逻辑 方法 或 许 是 最 针对 本 体 映 射 的 方法 。 毕 竟 ， 由 了 . Studer 定义 的 ， 本 体 是 “一 个 共享 
概念 体系 的 形式 化 规约 "， 利 用 源 本 体 和 目标 本 体 的 形式 化 表达 是 可 行 的 。 这 种 方法 的 一 个 严 
重 缺 陷 是 许多 实际 使 用 的 本 体 的 语义 是 轻 量 级 的 ， 因 此 没有 携带 很 多 逻辑 公式 。 


7.5.5 ”映射 实现 


已 经 有 一 些 本 体 映射 框架 ,例如 R2R 框架 9 和 LIMES ©, sameas.org 服务 从 不 同 数据 源 
采集 和 发 布 owl : sameAs 上 映射。 尽管 这 些 项 目 已 经 在 创建 映射 方面 大 幅 前 进 ， 但 这 还 是 一 个 
非常 有 挑战 的 领域 。 研 究 社区 已 经 在 过 去 9 年 中 举办 本 体 配 准 评测 活动 (Ontology Alignment 
Evaluation Initiative 9)， 以 鼓励 构建 更 加 精确 和 全 面 的 映射 。 


7.6 发 布 关系 数据 库 


大 多 数 当今 的 网 站 不 是 存储 在 万 维 网 服务 器 上 的 一 系列 静态 页 面 ， 而 是 从 存储 在 关系 数 
据 库 (relational database) 中 的 数据 动态 生成 的 。 例 如 ， 一 个 房地产 网 站 维护 各 种 房屋 和 公寓 
的 数据 库 ， 包 括 价格 、 位 置 和 便利 设施 。 这 个 数据 库 将 被 用 来 发 布 网 页 。 由 于 关系 数据 库 中 
存在 太 多 的 数据 ， 它 可 以 提供 一 个 方便 的 实例 数据 源 。 

下 面 ， 我 们 将 概述 发 布 关系 数据 库 为 本 体 的 过 程 。 


7.6.1 映射 术语 
首先 ， 我 们 回顾 数据 库 的 术语 ， 以 及 这 些 术 语 如 何 映射 到 RDFS/OWL 术语 。 下 面 是 一 个 
Ss http://www4.wiwiss.fu-berlin.de/bizer/r2r/., 


© _http://aksw.org/Projects/LIMES?v=z11. 
© ŽL http://oaei.ontologymatching.org/ . 
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房产 数据 库 中 的 表 (table) 的 例子 。 一 个 表 也 称 为 一 个 关系 〈relation)。 表 由 一 系列 包含 表 头 
的 列 组 成 ， 例 如 Homeld, City 和 Price。 这 些 列 称 为 属性 (attribute)。 表 的 每 行 称 为 一 个 元 组 
(tuple) 


Homes 


Prise Eua 


基于 这 些 术 语 ， 可 以 用 一 个 简单 的 方法 来 将 关系 数据 库 模式 映射 到 RDFS BK OWL. 2X 
据 库 中 的 每 个 表 被 认为 是 一 个 类 。 每 个 属性 ( attribute) 可 以 被 认为 是 一 个 属性 ， 而 每 个 元 组 
可 以 被 认为 是 一 个 实例 。 这 样 ， 在 我 们 的 例子 中 ， 我 们 有 Home 类 的 两 个 实例 。 每 个 实例 有 
一 个 city 属性 和 一 个 price 属性 ， 以 及 它们 对 应 的 值 (例如 ， 对 于 Homeld 为 1 的 实例 ， 它 的 
city 属性 的 值 是 Amsterdam ) 。 

当 进 行 映射 时 ， 还 必须 为 每 个 实体 创建 URI。 这 个 常 通过 在 属性 (attribute) 或 表 名 前 面 
添加 一 个 命名 空间 。 类 似 地 ， 经 常 可 以 使 用 主键 (primary key) 作为 每 个 实例 的 URI。 要 重点 
注意 的 是 ， 关 系数 据 库 和 RDF 之 间 的 主要 区 别 在 于 RDF 使 用 URI 来 标识 实体 ， 意 味 着 任何 
事物 都 有 一 个 全 球 唯一 的 标志 符 。 而 关系 数据 库 只 在 给 定数 据 库 的 局 部 范围 内 拥有 标志 符 。 






7.6.2 ”转换 工具 


由 于 关系 数据 库 映 射 到 本 体 存在 系统 化 的 机 制 ， 自 动 化 转换 过 程 是 可 能 的 。 存 在 一 些 已 
有 的 工具 ， 由 W3C 关系 数据 库 到 RDF 孵化 组 列 出 。 你 可 以 在 建议 阅读 里 发 现 这 个 报告 的 链 
接 。 这 些 工 具 中 的 大 多 数 通过 分 析 关 系数 据 库 的 结构 ， 然 后 生成 几乎 完整 的 RDF。 接 下 来 ， 
用 户 被 要 求 修改 配置 文件 来 指定 更 合适 的 URI 以 及 到 已 有 本 体 的 链接 。 例 如 ， 在 上 面 的 例子 
H, X} Amsterdam 可 以 使 用 DBpedia 的 URL 来 蔡 代 自动 生成 的 URI. 

转换 工具 经 常 提供 两 种 功能 。 一 种 直接 将 关系 数据 库 发 布 为 SPARQL 端点 。 第 二 种 是 将 
数据 库 的 大 部 分 转换 为 RDF， 使 得 之 后 可 以 被 载 人 三 元 组 存储 中 。 后 一 种 功能 常 被 用 于 将 实 
例 数 据 与 本 体 集成 并 需要 推理 时 。 一 个 推荐 的 起 始 工具 是 D2R Server 8， 因为 它 以 一 种 简单 
的 安装 包 的 形式 提供 了 上 述 两 种 功能 。 


7.7 语义 网 应 用 体系 结构 


构建 语义 网 不 仅 涉及 使 用 本 书 中 介绍 的 新 语言 ， 还 涉及 一 个 相对 不 同 的 工程 风格 和 一 个 
相对 不 同 的 应 用 集成 方法 。 为 说 明 这 点 ， 我 们 概述 一 组 语义 网 相关 的 工具 应 该 如 何 通过 语 
义 网 标准 被 集成 到 单个 轻 量 级 应 用 体系 结构 中 ， 以 实现 独立 的 工程 工具 间 的 互 操作 性 (参见 
图 7-1 )。 


© http:Wwww4.wiwiss.fu-berlin.de/bizer/d2r-server/。 
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图 7-1 语义 网 知识 管理 体系 结构 


7.7.1 知识 获取 


图 7-1 下 部 ， 我 们 发 现 了 使 用 表层 分 析 技 术 从 文档 中 获取 内 容 的 工具 。 这 些 文档 可 以 是 
无 结构 的 自然 语言 文档 ， 也 可 以 是 结构 化 或 半 结 构 化 的 文档 〈 例 如， 数据 库 、HTML 表格 和 
电子 表单 )。 

对 于 无 结构 的 文档 ， 这 些 工 具 通常 联合 使 用 统计 技术 和 浅 自 然 语言 技术 来 从 文档 中 抽取 
核心 概念 。 

对 于 更 结构 化 的 文档 ， 可 以 使 用 之 前 介绍 的 数据 库 转换 工作 。 归 纳 和 模式 识别 技术 被 用 
于 从 更 加 弱 结构 化 的 文档 中 抽取 内 容 。 


7.7.2 ”知识 存储 

分 析 工 具 的 输出 是 一 组 概念 ， 被 组 织 成 一 个 浅 的 概念 层次 ， 最 多 有 一 些 跨 分 类 的 联系 ， 
使 用 RDF 和 RDF 模式 就 足以 表达 这 些 被 抽取 的 信息 。 这 些 信息 还 包括 实例 数据 。 

除了 简单 地 存储 由 抽取 工具 产生 的 知识 外 ， 显 然 存 储 库 也 必须 提供 检索 这 些 知识 的 能 力 ， 
偏向 于 使 用 一 个 结构 化 查询 语言 ， 例 如 SPARQL。 任 何 合 理 的 RDF 模式 库 也 将 支持 RDF 模 
型 论 ， 包 括 基 于 定义 域 和 值 域 定义 的 类 成 员 关 系 的 演绎 ， 以 及 subClassOf 联系 的 传递 闭 包 的 
生成 等 。 

注意 ， 存 储 库 将 存储 本 体 (类 层次 、 属 性 定义 ) 和 本 体 的 实例 (属于 类 的 具体 个 体 ， 拥 有 
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特定 属性 的 个 体 对 )。 


7.7.3 ”知识 维护 

除了 基本 的 存储 和 检索 功能 ， 一 个 实用 的 语义 网 存储 库 还 提供 管理 和 维护 本 体 的 功能 : 
变更 管理 、 访 问 权 限 和 所 有 权 、 事 务 管理 。 

除了 从 无 结构 或 半 结 构 化 数据 中 自动 生成 的 轻 量 级 本 体 ， 还 必须 为 人 类 工程 师 提 供 对 知 
识 密集 型 本 体 的 支持 。 精 心 设计 的 编辑 环境 可 以 被 用 来 从 库 中 检索 本 体 ， 允 许 知 识 工 程 师 操 
纵 它们 ， 并 将 它们 放 回 到 存储 库 中 。 


7.7.4 知识 使 用 

存储 库 中 的 本 体 和 数据 将 被 应 用 程序 使 用 来 服务 终端 用 户 。 我 们 已 经 介绍 了 一 些 这 样 的 
应 用 。 此 外 ， 外 部 应 用 可 能 通过 以 下 的 一 种 或 多 种 方法 从 暴露 的 数据 中 存 取 知识 : SPARQL 
端点 、 链 接 数 据 或 RDFa。 


7.7.5 ”应 用 体系 结构 

在 On-To-Knowledge J AS, K 7-1 的 体系 结构 通过 组 件 之 间 轻 量 级 的 关联 来 实现 。 语 
法 的 互 操作 性 被 实现 ， 因 为 所 有 组 件 使 用 RDF 来 通信 。 语 义 互 操作 性 被 实现 ， 因 为 所 有 语义 
使 用 RDF 模式 表达 。 物 理 互 操作 性 被 实现 ， 因 为 组 件 之 间 所 有 的 通信 都 建立 在 简单 的 HTTP 
连接 上 ， 除 了 本 体 编 辑 器 之 外 的 所 有 组 件 都 被 实现 为 远程 服务 。 当 从 Amsterdam 操作 On-To- 
Knowledge 系统 时 ， 运 行 在 Norway (挪威 ) 的 本 体 抽取 工具 被 给 予 一 个 位 于 伦敦 的 文档 URL 
来 分 析 ， 生 成 的 RDF 和 RDF 模式 被 上 传 到 运行 在 Amersfoort (荷兰 ) 的 存储 服务 器 上 。 这 些 
数据 被 上 传 到 一 个 本 地 安装 的 本 体 编辑 器 中 ， 编 辑 之 后 ， 下 载 回 Amersfoort 的 服务 器 。 这 些 
数据 随后 被 用 于 驱动 一 个 瑞典 的 基于 本 体 的 网 站 生成 器 ， 以 及 一 个 位 于 英国 的 搜索 引擎 ， 它 
们 都 在 Amsterdam 的 浏览 髓 屏幕 上 展现 结果 。 

总 之 ， 所 有 这 些 工 具 都 是 远程 运行 的 ， 都 是 独立 于 工程 实现 的 ， 而 且 仅 依赖 HTTP 和 
RDF 来 获得 高 度 的 互 操 作 性 。 
7.7.6 ”框架 

存在 许多 框架 实现 了 上 述 体系 结构 。 例 如 ，Drupal 内 容 管理 系统 9 为 一 个 广泛 使 用 的 内 
容 管理 系统 添加 语义 支持 。 存 在 两 个 被 广泛 使 用 且 支 持 良好 的 开源 框架 : Jena 和 Sesame ©. 
最 后 ， 诸 如 Kasabi 和 Dydra 之 类 的 公司 提供 了 构建 语义 网 应 用 的 主 框 架 。 
建议 阅读 

一 些 被 用 作 本 章 基 础 的 重要 论文 包括 以 下 内 容 。 
http://www.ontoknowledge.org/; 
http://semantic-drupal.com/., 


http://jena.sourceforge.net/., 
http://openrdf.org/ 
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e N. Noy and D. McGuinness. Ontology Development 101: A Guide to CreatingYour First 
Ontology. 
www.ksl.stanford.edu/people/dlm/papers/ontology 101/ontology101-noy-meguinness.html. 

e B. Omelayenko. Learning of Ontologies for the Web: The Analysis of Existing Approaches. 
In Proceedings of the International Workshop on Web Dynamics,8th International 
Conference on Database Theory (ICDT 2001). 2001. 
www.cs.vu.nl/~borys/papers/WebDyn01.pdf. 


Satya S. Sahoo, WolfgangHalb, Sebastian Hellmann, Kingsley Idehen, Ted Thibodeau Jr, 
Sören Auer, Juan Sequeda, and Ahmed Ezzat. A Survey of Current Approaches for Mapping 
of Relational Databases to RDF (PDF). W3CRDB2RDF Incubator Group 2009-01-31. 
http://www.w3.org/2005/Incubator/rdb2rdf/RDB2RDF_SurveyReport.pdf. 
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两 本 被 经 常 引用 的 书 是 : 

e J. Davies, D. Fensel, and F. van Harmelen. Towards the Semantic Web:Ontology-Driven 
Knowledge Management. New York: Wiley, 2003. 

e A. Maedche. Ontology Learning for the Semantic Web. New York: Springer 2002. 214 


练习 和 项 目 


这 个 中 等 难度 的 项 目 可 以 由 2 或 3 个 人 在 2 ~ 3 个 星期 内 完成 。 所 有 需要 的 软件 都 可 以 
免费 获得 。 我 们 提供 一 些 已 经 成 功 使 用 过 的 软件 的 链接 ， 但 是 考虑 到 这 个 领域 的 发 展 非常 活 
跃 ， 可 用 的 软件 很 可 能 已 经 快速 更 新 了 。 另 外 ， 如 果 某 个 软件 没有 被 提 到 ， 这 不 意味 着 我 们 
不 同意 使 用 它 。 

作业 由 三 部 分 组 成 。 

1) 在 第 一 部 分 中 ， 你 将 创建 一 个 描述 领域 的 本 体 ， 包 含 你 自己 的 应 用 所 需 的 信息 。 你 将 
使 用 在 该 本 体 中 定义 的 术语 来 描述 具体 的 数据 。 在 这 步 中 ， 你 将 应 用 这 节 开 始 部 分 介绍 的 本 
体 构 建 方 法 学 ， 并 使 用 OWL 作为 你 的 本 体 的 表示 语言 (参见 第 4 章 )。 

2 ) 在 第 二 部 分 中 ， 你 将 使 用 你 的 本 体 来 为 你 的 数据 创建 不 同 的 视图 ,并且 你 将 查询 本 
体 和 数据 来 抽取 每 个 视图 所 需 的 信息 。 在 这 部 分 ， 你 将 应 用 RDF 存储 和 查询 软件 (参见 第 
2 He )s 

3 ) 在 第 三 部 分 中 ， 你 将 使 用 基于 万 维 网 的 技术 来 创建 被 抽取 数据 的 不 同 的 图 形 化 表示 。 

第 一 部 分 创建 一 个 本 体 

第 一 步 ， 确 定 一 个 应 用 领域 ， 建 议 是 你 拥有 充足 知识 的 或 者 你 很 容易 从 某 个 专家 那里 获 
取 这 些 知识 的 领域 。 

在 项 目的 描述 中 ， 我 们 使 用 广播 和 电视 节目 领域 , 包括 节目 、 播 出 计划 、 频 道 、 风 格 、 
名 人 人。 当然， 你 可 以 用 你 选择 的 领域 来 蔡 换 这 个 领域 。 在 我 们 自己 的 课程 中 ， 我 们 每 年 使 用 [215] 
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不 同 的 领域 ， 从 大 学 排名 到 电影 ， 到 财富 500 强 。 

第 二 步 ， 你 将 使 用 OWL 建立 本 体 来 描述 该 领域 (例如 ， 你 的 教员 )。 这 个 本 体 不 必 和 覆盖 
完整 的 领域 ,但 是 应 该 至 少 包 含 几 十 个 类 。 特 别 注意 本 体 的 质量 (宽度 、 深 度 )， 并 有 针对 性 
地 使 用 越 多 的 OWL 的 表达 能 力 越 好 。 在 这 步 中 存在 许多 可 用 的 工具 。 当 前 最 好 的 工具 或 许 
是 Protégé ,但 是 我 们 觉得 TopBraid Composer 也 不 错 。 

如 果 你 有 野心 ， 甚 至 可 以 使 用 从 文本 中 抽取 本 体 的 工具 ， 或 试验 允许 你 导 和 人 诸如 Excel 
表单 tab 界定 的 文件 之 类 的 半 结 构 化 数据 源 的 工具 (如 Excel2RDF, ConvertToRDF, Any23 
或 XLWrap) 来 开始 你 的 本 体 开 发 。 当 然 ， 你 可 能 会 选择 从 本 领域 的 某 些 已 有 的 本 体 开 始 。 

同时 建议 使 用 一 个 推理 引擎 来 验证 你 的 本 体 和 检查 不 一 致 性 。 如 果 你 使 用 Protégé， 你 
可 能 希望 利用 一 些 已 有 的 编辑 器 插件 ， 例 如 对 你 的 本 体 或 使 用 Pellet 或 HermiT 推理 的 多 种 
可 视 化 。 

第 三 步 ， 将 你 的 本 体 和 具体 的 实例 及 属性 一 起 发 布 。 依 赖 于 编辑 工具 的 选择 ， 这 步 可 以 
通过 使 用 相同 的 工具 完成 ( Protégé)， 或 者 给 定 RDF 中 实例 的 简单 语法 结构 ， 你 甚至 可 能 决 
定 手工 写 下 这 些 实例 或 者 编写 一 些 简单 的 脚本 来 从 可 用 的 数据 源 中 抽取 实例 信息 。 例 如 ， 你 
可 以 将 一 个 关系 数据 库 及 给 定数 据 转换 为 RDF。 或 者 你 可 能 希望 从 许多 包含 广播 和 电视 播 出 
计划 、 节 目 、 风 格 和 名 人 的 网 站 上 搜刮 一 些 信息 。BBC 甚至 提供 了 一 个 方便 的 应 用 编程 接口 
来 直接 查询 它们 的 播 出 计划 9。 你 可 能 希望 使 用 W3C 提供 的 语法 验证 服务 ”一 一 这 个 服务 不 
仅 验证 你 的 文件 的 语法 正确 性 ， 也 提供 了 对 已 有 三 元 组 的 可 视 化 。 同 时 ， 在 这 步 中 你 或 许 能 
够 试验 一 些 允许 从 半 结 构 数据 源 中 导入 数据 的 工具 。 

在 这 步 结束 时 ， 你 应 该 能 够 提供 下 面 的 东西 。 

。 完整 的 OWL 本 体 。 

。 本 体 的 实例 ， 使 用 RDF 描述 。 

。 一 个 描述 本 体 范围 以 及 在 建 模 过 程 中 你 做 出 的 主要 设计 决定 的 报告 。 

第 二 部 分 “使 用 SPARQL 查询 建立 概况 

接 下 来 ， 你 将 使 用 查询 工具 来 抽取 你 的 本 体 和 数据 中 的 相关 部 分 。 为 实现 这 点 ， 你 需要 
在 某 个 库 中 存储 你 的 本 体 的 方法 来 支持 查询 和 推理 工具 。 你 可 以 使 用 Sesame RDF 存储 和 查 
询 工 具 S， 它 绑 定 了 一 个 OWLIM 推理 机 。 我 们 也 发 现 Joseki Sparql Server 是 一 个 好 的 起 始 
点 ， 因 为 它 提供 了 一 个 内 建 的 万 维 网 服务 器 。 

第 一 步 是 上 载 你 的 本 体 (以 RDF/XML 或 Turtle 的 格式 ) 并 将 实例 关联 到 库 中 。 这 可 能 需 
要 一 些 安装 步骤 。 

接 下 来 ,使 用 SPARQL 查询 语言 来 定义 不 同 的 用 户 概况 ， 并 使 用 查询 为 每 个 概况 抽取 相 
关 数 据 。 





http://protege.stanford.edu/, 

参见 http://topquaddrant.com/products/TB_Composer.html。 
参见 http://www.bbc.co.uk/programmes/developers。 
http://www.w3.org/RDF/Validator/ 
http://www.openrdf.org/. 
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以 建 模 电 视 节 目 为 例 ， 你 可 能 选择 为 有 特别 偏好 (体育 、 时 事 ) 的 人 们 或 特殊 年 龄 组 的 观 
众 〈 例 如 未 成 年 人 ) 定义 观看 指南 ， 从 多 个 (其 至 跨国 的 ) 电视 台 收 集 数 据 ， 为 宽带 或 移动 连 
接 访 问 生 成 表现 形式 ， 等 等 。 

定义 一 个 概况 的 查询 的 输出 通常 使 用 XML 或 JSON (JavaScript Object Notation) 的 形式 。 

第 三 部 分 “表示 基于 概况 的 信息 

使 用 第 二 部 分 的 查询 输出 ， 为 不 同 概况 生成 一 个 人 类 可 读 的 表示 形式 。 根 据 你 最 喜欢 的 
编程 语言 ， 有 一 些 方便 的 库 用 来 查询 SPARQL 端点 : Python 拥有 SPARQLWrapper ©, PHP 
拥有 ARC2 库 S， 而 Java 用 户 会 喜欢 ARQ 8， 它 是 流行 的 Jena 库 的 一 部 分 。 甚 至 有 一 些 从 
Javascript 中 可 视 化 SPARQL 结果 的 库 ， 例 如 sgvizler ©. 

这 部 分 的 挑战 在 于 从 第 一 部 分 和 第 二 部 分 生成 和 选择 的 数据 中 ， 定 义 数 据 的 可 浏览 的 、 
高 度 相互 链接 的 表示 形式 。 

领域 的 其 他 选择 

除了 使 用 描述 广播 节目 领域 的 半 结 构 化 数据 集 ， 还 可 能 建 模 一 个 大 学 的 教 职 工 领 域 ， 包 
括 教师 、 课 程 和 院 系 。 在 这 个 例子 中 ， 你 可 以 使 用 在 线 数 据 源 ， 例 如 从 教 职 工 电 话 册 中 的 信 
息 、 经 历 描述 、 教 学 计划 等 中 获得 本 体 和 实例 数据 。 这 个 领域 中 的 示例 概况 可 能 有 不 同年 份 
的 学 生 概 况 、 外 国学 生 的 概况 、 学 生 和 教师 的 概况 ， 等 等 。 

总 结 

在 完成 项 目的 所 有 部 分 之 后 ， 你 已 经 能 有 效 地 实现 图 7-1 中 展现 的 体系 结构 的 大 部 分 。 
你 已 经 使 用 了 本 书 介绍 的 大 部 分 语言 (RDF、RDF 模式 、SPARQL、OWL2 )， 并 且 已 经 构建 
了 一 个 真正 的 语义 网 应 用 : 用 一 个 本 体 来 建 模 部 分 世界 ， 用 查询 来 定义 特定 用 户 的 视图 ， 以 
及 用 万 维 网 技术 来 定义 特定 用 户 视图 的 可 浏览 的 表示 形式 。 


http://sparql-wrapper.sourceforge.net/。 
http://incubator.apache.org/jena/documentation/query/index.html。 
http://incubator.apache.org/jena/。 
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语义 网 的 愿景 已 经 成 为 现实 。 正 如 在 第 6 章 中 讨论 的 ， 越 来 越 多 的 公司 、 政 府 和 用 户 正 
在 采用 本 书 中 介绍 的 标准 、 技 术 和 方法 。 我 们 看 到 了 如 何 将 万 维 网 的 概念 分 解 为 一 个 灵活 的 
数据 模型 ，RDF， 使 得 应 用 之 间 可 以 交换 和 复 用 信息 。 基 于 这 个 数据 模型 ， 我 们 看 到 了 如 何 
逐步 添加 更 丰富 的 语义 ， 人 允许 产生 逐步 增强 的 推理 (第 2 章 )。OWL2 (第 4 章 ) 允许 构建 丰 
富 的 知识 表示 ， 而 规则 语言 (第 5 章 ) 允许 系统 性 地 编 入 特定 应 用 的 推理 。 所 有 信息 通过 一 个 
集成 于 万 维 网 的 查询 语言 SPARQL 来 使 用 (第 3 章 )。 最 后 ， 我 们 看 到 了 本 体 工 程 方法 如 何 用 
于 创建 更 智能 的 、 更 先进 的 应 用 (第 6 章 )。 

贯穿 本 书 ， 我 们 看 到 了 这 些 技 术 是 如 何 植 根 于 计算 机 学 科 宽 广 的 知识 当中 ， 包 括 人 工 知 

221] 能 、 数 据 库 、 分 布 式 系统 等 ， 并 且 我 们 还 指出 了 进一步 学 习 所 涉及 内 容 的 地 方 。 我 们 鼓励 读 

者 更 深入 地 学 习 这 些 领 域 。 


8.1 原理 


学 习 语 义 网 不 仅 是 学 习 其 中 的 应 用 或 技术 ， 它 还 提供 了 一 组 有 助 于 设计 系统 的 通用 原理 ， 
而 这 些 系统 甚至 不 使 用 语义 网 的 方法 。 我 们 在 这 里 重新 回顾 一 下 。 


8.1.1 提供 一 个 从 轻 量 级 到 重量 级 技术 的 路 线 

开发 者 和 用 户 需 要 简单 的 技术 入 口 ， 同 时 也 需要 在 他 们 的 需求 增长 时 能 够 增加 复杂 性 。 
过 渡 路 线 这 一 概念 已 被 成 功用 于 语义 网 。 例 如 ， 可 以 从 RDF 中 的 一 个 简单 数据 模型 开始 ， 逐 
渐 过 渡 到 更 加 丰富 的 、 更 强 的 OWL 语言 。 在 OWL 中 甚至 也 有 多 种 选择 ， 从 简单 的 支持 快速 
推理 的 规则 版 本 到 OWL2 Full 的 复杂 描述 。 


8.1.2 ”标准 节约 时 间 
万 维 网 和 类 似 的 语义 网 受益 于 标准 。 这 些 标准 意味 着 信息 的 消费 者 不 必 担 心 如 何 适应 每 
个 新 的 信息 生产 者 。 同 样 地 ， 生 产 者 知道 他 们 正在 给 消费 者 提供 他 们 想 要 的 。 没 有 必要 重新 
发 明 语法 或 模型 。 在 语义 网 中 ,标准 使 得 信息 的 复 用 成 为 可 能 。 如 果 我 在 我 的 应 用 中 想 要 关 
于 Amsterdam 的 信息 ， 我 不 再 需要 自己 去 收集 ， 而 是 可 以 将 我 的 应 用 建立 在 可 用 的 维基 百科 
(LAER RDF 表示 形式 ，DBpedia) 之 上 。 这 种 复 用 能 力 节约 了 应 用 开发 和 集成 的 时 间 。 语 义 
网 社区 一 直 学 习 从 标准 中 获 益 。 不 仅 是 标准 化 格式 和 技术 ， 而 且 还 标准 化 本 体 和 其 他 内 容 ， 
这 些 都 已 经 逐渐 开展 。 
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8.1.3 ”链接 是 关键 

和 万 维 网 类 似 , 语义 网 的 能 力 在 于 它 的 链接 。 链 接 使 得 知识 可 以 分 布 在 不 同 的 组 织 、 人 
和 系统 中 。 这 让 知识 的 最 想 获 得 者 能 得 到 它 ， 也 依然 让 他 人 能 访问 它 、 发 现 它 。 足 够 轻 量 级 
的 链接 使 其 很 容易 被 创建 ， 同 时 又 足够 强大 到 允许 知识 的 集成 。 我 们 在 链接 数据 云 中 看 到 了 
数 以 百 计 的 特定 数据 集 可 以 依赖 于 其 他 特定 数据 集 ， 它 们 (以 一 种 简单 的 方式 ) 提供 了 有 关 某 
个 主题 或 概念 的 更 多 、 更 细节 的 知识 。 可 以 这 样 说 ， 在 任何 一 个 大 的 信息 系统 中 ， 链 接 的 能 
力 可 以 预测 其 成 功 或 失败 。 


8.1.4 一 点 语义 可 以 影响 深远 

语义 网 的 一 位 先驱 Jim Hendler 创造 了 术语 “A little semantics goes a long way”。 这 人 句 话 
强调 自动 理解 术语 含义 的 能 力 的 重要 性 。 共 享 数据 是 不 够 的 还 需要 共享 含义 。 简 单 地 知 
if bank 指 的 是 一 张 长 椅 而 非 一 个 金融 机 构 对 构建 精准 的 系统 作用 巨大 。 在 本 书 中 ， 我 们 已 经 
介绍 了 为 数据 添加 语义 及 在 应 用 中 使 用 它们 的 技术 。 是 否 在 系统 中 采用 这 些 特 别 的 技术 是 一 
回 事 ， 但 关键 原则 是 认识 到 语义 可 以 是 一 种 差异 化 要 素 。 

上 述 原理 已 经 帮助 语义 网 取得 了 成 功 ， 但 更 重要 的 是 ， 它 们 适用 于 其 他 任何 大 规模 软件 
系统 或 技术 集 的 设计 。 





8.2 展望 


语义 网 依然 在 发 展 和 变化 。 现 有 技术 正在 被 改良 而 新 技术 正在 研发 之 中 。 概 括 地 说 ， 存 
在 以 下 正 被 活跃 研究 的 主要 研究 方向 。 

。 语 境 中 的 推理 。 这 使 得 推理 具有 不 仅 依赖 于 给 定 的 知识 ， 还 依赖 于 应 用 所 处 的 环境 和 
知识 来 源 ( 它 的 出 处 ) 的 能 力 。 例 如 ， 当 你 刚 开 始 寻找 公寓 时 ， 你 可 能 会 相信 和 某 个 有 
关公 寓 的 数据 源 ， 但 是 在 做 最 终 决定 时 可 能 就 不 再 相信 了 。 

。 大 规模 推理 。 由 于 语义 网 上 的 数据 量 不 断 增长 ， 使 得 推理 这 些 数据 变 得 非常 困难 。 诸 
如 大 型 知识 对 撞 机 (Large Knowledge Collidor, http://www.larkc.eu) 的 项 目 已 经 展示 了 
在 数 以 亿 计 的 三 元 组 上 开展 简单 的 规则 式 推理 的 能 力 。 但 是 ， 伴 随 语义 的 复杂 性 增长 
以 及 数据 和 知识 量 持续 爆炸 ， 需 要 有 更 好 、 更 快 的 推理 机 。 

。 分 布 式 查询 。 当 前 在 语义 网 上 使 用 分 布 式 知识 源 的 标准 做 法 是 从 各 种 数据 源 中 获取 并 
集中 化 知识 。 这 么 做 的 缘由 是 效率 。 但 是 ， 至 于 如 何 使 用 仍然 是 一 个 开放 问题 ， 并 且 
对 于 特殊 查询 如 何 使 用 这 些 分 布 式 信息 源 而 不 必 集 中 化 它们 也 是 一 个 问题 。 

。 流 知识 。 语 义 网 技术 主要 处 理 静 态 的 或 缓慢 变化 的 信息 。 这 一 现状 正在 快速 改变 ， 传 
感 器 、 微 博 和 其 他 来 源 的 信息 正 加 速 产 生 。 开 放 问 题 包 括 如 何 从 这 些 流 数 据 源 中 抽取 、 
推理 和 使 用 语义 。 

这 些 只 是 一 些 当前 语义 网 相关 的 热点 研究 方向 。 语 义 网 领域 本 身 和 它 的 技术 正在 快速 发 

展 。 本 书 只 是 介绍 了 核心 基础 ， 给 语义 网 下 结论 还 言 之 尚 早 。 想 要 了 解 目 前 的 进展 ， 请 访问 
在 线 补充 材料 : http://www.semanticwebprimer.org。 


附 录 | 


A Semantic Web Primer, Third Edition 


XML 基础 


A.1 XML 语言 

一 个 XML 文档 (XML document) 由 一 段 序言 、 一 些 元 素 和 一 段 可 选 的 尾声 组 成 (不 在 这 
里 讨论 )。 
A.1.1 序言 


序言 由 一 个 XML 声明 和 一 个 可 选 的 外 部 结构 文档 的 引用 组 成 。 这 是 一 个 XML 声明 
(XML declaration) 的 例子 : 


<?xml version="1.0" encoding="UTF-16"?> 
它 指明 了 当前 文档 是 一 个 XML 文档 ， 并 定义 了 其 版 本 和 用 于 特定 系统 的 字符 编码 (例如 


UTF-8、UTF-16 和 ISO 8859-1 )。 字 符 编码 不 是 强制 性 的 ,但 是 指明 它 被 认为 是 好 的 做 法 。 
有 时 我 们 也 指明 文档 是 否 是 自 包 含 的 一 一 即 它 是 否 不 涉及 外 部 结构 文档 : 


<?xml version="1.0" encoding="UTF-16" standalone="no"?> 


外 部 结构 文档 的 一 个 引用 看 起 来 像 这 样 : 

<!IDOCTYPE book SYSTEM "book.dtd"> 
这 里 ， 结 构 信 息 可 以 在 一 个 称 为 book.dtd 的 本 地 文件 中 找到 。 引 用 也 可 以 是 一 个 URL。 如 果 
仅仅 使 用 一 个 本 地 识别 的 名 称 或 者 一 个 URL， 那 么 就 使 用 标记 SYSTEM。 然 而 ， 如 果 希 望 同 
时 给 出 一 个 局 部 名 称 和 一 个 URL， 那 么 则 应 该 使 用 标记 PUBLIC. 
A.1.2 ”元素 


XML 元 素 表 示 这 个 XML 文档 谈论 的 “事物 ”， 例 如 图 书 、 作 者 和 出 版 社 。 它 们 构成 了 
XML 文档 的 主要 概念 。 一 个 元 素 由 一 个 开始 标签 (opening tag)、 它 的 内 容 (content) 和 一 个 
结束 标签 (closing tag) 组 成 。 例 如 ， 


<lecturer>David Billington</lecturer> 
标签 名 称 几 乎 可 以 自由 选择 ， 只 有 非常 少 的 一 些 限 制 。 最 重要 的 限制 是 首 字符 必须 是 字 


母 、 下 划 线 或 冒号 ， 并 且 名 称 不 能 以 字符 串 “xml” 的 任何 大 小 写 形式 开头 〈 例 如 “Xml” 和 
“XML” )。 
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内 容 可 以 是 文本 、 其 他 元 素 或 空缺 。 例 如 ， 
<lecturer> 
<name>David Billington</name> 
<phone>+61-7-3875 507</phone> 


</lecturer> 


如 果 没 有 内 容 ， 那 么 元 素 叫 做 空 (empty)。 一 个 形 如 以 下 的 空 元 素 


<lecturer></lecturer> 


可 以 被 简写 为 


<lecturer/> 


A.1.3 属性 


一 个 空 元 素 未 必 没 有 意义 ， 因 为 它 可 能 有 一 些 属性 (attribute)。 一 个 属性 是 一 个 元 素 的 开 
始 标签 内 的 一 个 名 一 值 对 : 
<lecturer name="David Billington" phone="+61-7-3875 507"/> 
这 是 一 个 非 空 元 素 的 属性 的 例子 : 
<order orderNo="23456" customer="John Smith" 
date="October 15, 2002"> 
<item itemNo="a528" quantity="1"/> 


<item itemNo="c817" quantity="3"/> 


</order> 


RESET A MU FIER, FR SURO HR RE 


<order> 

<orderNo>23456< /orderNo> 

<customer>John Smith</customer> 

<date>October 15, 2002</date> 

<item> 
<itemNo>a528</itemNo> 
<quantity>1</quantity> 

</item> 

<item> 
<itemNo>c817</itemNo> 
<quantity>3</quantity> 

</item> 


</order> 


ay EY ASE Fc He FAA AY ES eA ae EL BEE EIR EA BE BRE. 


N 
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A14 注释 
一 条 注释 是 一 段 会 被 解析 器 忽略 的 文本 。 它 具有 以 下 形式 : 


<!— This is a comment --> 


A.1.5 “处理 指令 


处 理 指令 (Processing Instruction, PI) 提供 了 一 种 向 一 个 应 用 程序 传递 关于 如 何 处 理 元 素 
的 信息 的 机 制 。 一 般 形 式 是 : 


<?target instruction?> 


例如 ， 


<?stylesheet type="text/css" href="mystyle.css"?> 
PI 在 一 个 声明 式 的 环境 中 提供 了 过 程式 的 可 能 性 。 


A.1.6 ” 良 构 的 XML 文档 
一 个 语法 上 正确 的 XML 文档 称 为 是 良 构 的 。 以 下 是 一 些 语法 规则 。 
。 文档 中 只 有 一 个 最 外 层 元 素 ( 称 为 根 元 素 (root element) ) 。 
。 每 个 元 素 包 含 一 个 开始 和 一 个 对 应 的 结束 标签 。 
。 ENEE, Biin 


<author><name>Lee Hong</author></name>. 


。 一 个 元 素 内 的 属性 有 唯一 的 名 称 。 
。 元 素 和 标签 名 称 必 须 是 合法 的 。 


A.1.7 XML 文档 的 树 模型 


可 以 将 良 构 的 XML 文档 表示 为 树 ， 因 此 ， 树 为 XML 提供 了 一 个 形式 化 的 数据 模型 。 这 
种 表示 往往 是 有 益 的 。 作 为 一 个 例子 ， 考 虑 以 下 文档 : 


<?xml version="1.0" encoding="UTF-16"?> 
<!DOCTYPE email SYSTEM "email.dtd" > 
<email> 
. 
<head> 
<from name="Michael Maher" 
address="michaelmaher@cs.gu.edu.au"/> 
<to name="Grigoris Antoniou" 
address="grigoris@cs.unibremen.de" /> 
<subject>Where is your draft?</subject> 
</head> 


<body> 
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Grigoris, where is the draft of the paper 
you promised me last week? 
</body> 


</email> 


图 A-1 展现 了 这 个 XML 文档 的 树 表示 。 它 是 一 棵 有 序 的 、 有 标记 的 树 。 

。 恰 有 一 个 根 。 

。 RAK. 

。 每 个 节点 ， 除 了 根 以 外 ， 恰 有 一 个 父 节 点 。 

。 每 个 节点 有 一 个 标记 。 

© 元 素 的 顺序 是 重要 的 。 

然而 ， 尽 管 元 素 的 顺序 是 重要 的 ， 属 性 的 顺序 却 并 非 如 此 。 因 此 ， 以 下 两 个 元 素 是 等 
价 的 : 


<person lastname="Woo" firstname="Jason" /> 


<person firstname="Jason" lastname="Woo" /> 


这 方面 没有 在 树 中 恰当 地 表示 出 来 。 一 般 来 说 ， 我 们 要 求 一 个 更 加 细致 的 树 的 概念 ， 例 
如 ， 我 们 也 应 该 区 分 不 同类 型 的 节点 (元素 节点 、 属 性 节点 等 )。 然 而 ， 这 里 我 们 使 用 图 作为 
示例 ， 因 此 我 们 不 再 深入 到 细节 中 。 

图 A-1 也 体现 出 根 (root) (表示 这 个 XML 文档 ) 有 别 于 根 元 素 ( root element) 一 一 即 例 
子 中 的 email 元 素 。 这 一 区 别 在 讨论 寻 址 和 查询 XML 文档 时 有 所 体现 。 

















Grigoris, 
where is the 
draft of the 
paper you 





1 1 i 

1 i 1 

i i 1 
Michael michaelmaher@ Grigoris 
Maher cs.gu.edu.au Antoniou 


图 A-1 一 个 XML 文档 的 树 表示 


1 
grigorisé Where is promised me 
cs.unibremen.de your draft last week? 
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A.2 结构 化 


一 个 遵循 特定 语法 规则 的 XML 文档 是 良 构 的 。 然 而 ， 那 些 规则 并 没有 特别 规定 文档 的 结 
构 。 现 在 ， 想 象 两 个 试图 通信 并 希望 使 用 相同 词汇 表 的 应 用 。 为 此 ， 就 需要 定义 所 有 可 能 用 
到 的 元 素 和 属性 名 称 。 进 一 步 地 , 结构 也 应 当 被 定义 : 一 个 属性 可 以 取 哪 些 值 ， 哪 些 元 素 可 
能 或 者 必须 出 现在 其 他 元 素 中 ,等 等 。 

有 了 这 样 的 结构 化 信息 ， 我 们 就 有 了 验证 文档 的 更 大 可 能 性 。 我 们 说 一 个 XML 文档 是 有 
效 的 (valid)， 如 果 它 是 良 构 的 ,使 用 了 结构 化 信息 并 且 遵 循 这 一 信息 。 

有 两 种 定义 XML 文档 结构 的 方法 : DTD 一 一 古老 且 更 受 限 的 方法 ; XML 模式 一 一 其 主 
要 为 数据 类 型 的 定义 提供 了 扩展 的 可 能 性 。 





A.2.1 DTD 


1. 外 部 和 内 部 DTD 
一 个 DTD 的 组 件 可 以 定义 在 一 个 单独 的 文件 中 (外 部 DTD (external DTD)), 或 者 定义 
在 XML 文档 本 身 的 内 部 (内 部 DTD (internal DTD))。 通常 ,最 好 使 用 外 部 DTD， 因 为 它们 
的 定义 可 以 跨越 多 个 文档 使 用 ;否则 宛 余 不 可 避免 ， 并 且 长 期 维护 一 致 性 会 变 得 困难 。 
2. 元 素 
考虑 上 一 节 中 的 元 素 : 
<lecturer> 
<name> David Billington</name> 
<phone>+61-7-3875 507</phone> 


</lecturer> 
这 个 元 素 类 型 9 的 一 个 DTD 类 似 这 样 : 
<!ELEMENT lecturer (name,phone)> 


<!ELEMENT name (#PCDATA)> 
<!ELEMENT phone (#PCDATA)> 


这 段 DTD 的 含义 如 下 。 

e 元 素 类 型 lecturer、name fil phone 可 以 在 文档 中 使 用 。 

。 一 个 lecturer 元 素 按 序 包含 一 个 name 元 素 和 一 个 phone 元 素 。 

。 name JURA phone 元 素 可 以 有 任何 内 容 。 在 DTD 中 ，#PCDATA 是 元 素 唯 一 的 原子 
类 型 。 

如 下 描述 一 个 lecturer 元 素 包含 一 个 name 元 素 或 者 一 个 phone 元 素 : 


<!ELEMENT lecturer (name|phone)> 
当 我 们 想 要 以 任何 顺序 指明 一 个 Lecturer 元 素 包 含 一 个 name 元 素 和 一 个 bphone Jt 


O 元 素 类 型 lecturer 和 该 类 型 的 一 个 特定 元 素 ， 例 如 David Billington， 之 间 的 区 分 应 该 是 清晰 的 。 类 型 
lecturer 的 所 有 特定 元 素 (KH lecturer 元 素 ) 共享 这 里 定义 的 相同 结构 。 


XML Žak 135 





素 时 ， 会 更 困难 一 些 。 我 们 只 能 使 用 这 个 技巧 
<!ELEMENT lecturer ((name,phone)|(phone,name))> 


然而 ， 这 种 方法 在 实际 使 用 中 受到 局 限 〈 试 想 一 下 以 任何 顺序 时 的 10 个 元 素 )。 
3. 属性 
考虑 上 一 节 中 的 元 素 : 


<order orderNo="23456" customer="John Smith" 
date="October 15, 2002"> 
<item itemNo="a528" quantity="1"/> 
<item itemNo="c817" quantity="3"/> 


</order> 
它 的 一 个 DTD 类 似 这 样 : 


<!ELEMENT order (item+)> 
<!ATTLIST order 
orderNo ID #REQUIRED 
customer CDATA #REQUIRED 
date CDATA #REQUIRED> 
<!ELEMENT item EMPTY> 
<!ATTLIST item 
itemNo ID #REQUIRED 
quantity CDATA #REQUIRED 
comments CDATA #IMPLIED> 


与 上 一 个 例子 相 比 ， 一 个 新 的 地 方 是 item 元 素 类 型 定义 为 空 。 另 一 个 新 的 地 方 是 在 
order 元 素 类 型 的 定义 中 ,在 item 之 后 出 现 的 +。 它 是 势 运算 符 〈cardinality operator) 
之 一 : 

2: 出 现 零 次 或 一 次 。 

*: 出 现 零 次 或 多 次 。 

+; 出 现 一 次 或 多 次 。 

没有 势 运算 符 就 表示 恰好 一 次 。 

除了 定义 元 素 以 外 ， 还 要 定义 属性 。 这 通过 一 个 属性 列表 (attribute list) 来 实现 。 第 一 
个 组 件 是 列表 运用 到 的 元 素 类 型 的 名 称 ， 接 下 来 是 一 些 属性 名 称 、 属 性 类 型 和 取 值 类 型 构 
成 的 三 元 组 。 一 个 属性 (attribute) 名 称 是 一 个 可 以 在 一 个 使 用 DTD 的 XML 文档 中 使 用 的 
名 称 。 

4. 属性 类 型 

属性 类 型 与 预定 义 数据 类 型 类 似 ， 但 其 选择 非常 有 限 。 最 重要 的 属性 类 型 是 : 

e CDRTR， 一 个 字符 串 〈 字 符 序 列 )。 
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。 ID, #0 XML 文档 范围 内 唯一 的 一 个 名 称 。 
。 IDREF， 对 另 一 个 元 素 的 一 个 引用 ， 该 元 素 ID 属性 与 此 IDREF 属性 具有 相同 的 
取 值 。 

e IDREFS, 一 系列 IDREF。 

© (vl…|v,)， 所 有 可 能 取 值 的 枚 举 。 

这 样 的 选择 并 不 令 人 满意 。 例 如 ， 日 期 和 数字 不 能 被 指明 ， 它 们 只 能 被 解释 为 字符 串 
(CDATA)， 因 此 ， 它 们 的 特定 结构 不 能 被 强制 。 

5. 取 值 类 型 

有 4 种 取 值 类 型 。 | 
#REQUIRED。 这 个 元 素 类 型 每 次 在 XML 文档 中 出 现时 ， 这 个 属性 也 必须 出 现 。 在 上 
一 个 例子 中 ，itemNo Ml quantity 必须 总 是 出 现在 item 元 素 内 。 
#IMPLIED。 这 个 属性 的 出 现 是 可 选 的 。 在 这 个 例子 中 ,注释 是 可 选 的 。 
#FIXED“ 取 值 ” 。 每 个 元 素 必 须 有 这 个 属性 ， 其 总 是 取 DTD 中 #FIXED 之 后 给 定 的 
取 值 。 在 XML 文档 中 给 定 某 个 取 值 是 无 意义 的 ， 因 为 它 被 固定 值 覆 盖 了 。 
“ 取 值 ” 。 这 指定 了 这 个 属性 的 默认 值 。 如 果 一 个 具体 的 取 值 出 现在 XML 文档 中 ， 它 
会 覆盖 默认 值 。 例 如 ， 电 子 邮件 系统 的 默认 编码 为 “mime”， 但 也 可 以 用 “binhex"”， 
如 果 用 户 显 式 指 定 。 
6. 引用 
这 是 一 个 使 用 IDREF 和 IDREFS 的 例子 。 首 先 我 们 给 出 一 个 DTD: 


<!ELEMENT family (person*)> 


<!ELEMENT person (name)> 
<!ELEMENT name (#PCDATA)> 
<!ATTLIST person 
id ID ##REQUIRED 
mother IDREF #IMPLIED 
father IDREF #IMPLIED 
children IDREFS #IMPLIED> 


遵循 这 个 DTD 的 一 个 XML 元 素 如 下 : 
<family> 
<person id="bob" mother="mary" father="peter"> 


<name>Bob Marley</name> 


</person> 


<person id="bridget" mother="mary"> 


<name> Bridget Jones</name> 
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</person> 


<person id="mary" children="bob bridget" > 
<name>Mary Poppins</name> 


</person> 


<person id="peter" children="bob" > 
<name>Peter Marley</name> 


</person> 


</family> 


读者 应 该 研究 person 之 间 的 那些 引用 关系 。 

7. XML 实体 

一 个 XML 实体 可 以 扮演 多 种 角色 ， 例 如 重复 字符 的 占 位 符 〈 作 为 一 种 快捷 记 法 )、 一 段 
外 部 数据 (例如 XML 或 其 他 ) 或 者 作为 元 素 的 声明 的 一 部 分 。 例 如 ， 假 设 一 个 文档 有 几 个 版 
权 声 明 都 提 到 了 当前 的 年 份 ， 那 么 声明 一 个 实体 就 有 意义 了 。 


<!ENTITY thisyear "2007"> 


于 是 ， 在 需要 包含 当前 年 份 的 每 个 地 方 ， 我 们 都 可 以 使 用 实体 引用 &thisyear; 来 代 
替 。 这 样 ， 要 想 将 整个 文档 的 年 份 值 更 新 为 “2008” 意 味 着 只 要 改变 这 个 实体 声明 就 行 了 。 

8. 一 个 总 结 性 的 例子 

作为 一 个 最 终 的 例子 ， 我 们 为 之 前 呈现 的 email 元 素 给 出 一 个 DTD: 


<!ELEMENT email (head,body)> 
<!ELEMENT head (from,to+,cc*,subject)> 
<!ELEMENT from EMPTY> 
<!ATTLIST from 
name CDATA #IMPLIED 
address CDATA #REQUIRED> 
<!ELEMENT to EMPTY> 
<!ATTLIST to 
name CDATA #IMPLIED 
address CDATA #REQUIRED> 
<!ELEMENT cc EMPTY> 
<!ATTLIST cc 
name CDATA #IMPLIED 
address CDATA #REQUIRED> 
<!ELEMENT subject (##PCDATA)> 


<!ELEMENT bocy (text,attachment*)> 
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<!ELEMENT text (#PCDATA)> 
<!ELEMENT attachment EMPTY> 
<!ATTLIST attachment 

encoding (mime|binhex) "mime" 


file CDATA #REQUIRED> 


我 们 浏览 这 个 DTD 中 一 些 有 趣 的 部 分 。 

。 一 个 head 元 素 按 序 包 含 了 一 个 from 元 素 、 至 少 一 个 to 元 素 、 零 个 或 更 多 的 cc 元 
素 以 及 一 个 subject 元 素 。 

在 from, to 和 cc 元 素 中 ，name 属性 并 不 是 必需 的 ; 另 一 方面 ，address 属性 总 
是 必需 的 。 

。 — body 元素 包含 一 个 text 元 素 ， 可 能 还 会 跟着 一 些 attachment 元 素 。 

一 个 attachment 元 素 的 encoding 属性 的 取 值 必须 是 “mime ”或 者 是 “binhex”， 
前 者 是 默认 值 。 

我 们 以 关于 DTD 的 两 个 额外 讨论 作为 结束 。 首 先 ， 一 个 DTD 可 以 被 解释 为 一 个 扩展 的 


巴 科 斯 范式 (Extended Backus-Naur Form, EBNF)» ln, L F BH 


<!ELEMENT email (head,body)> 


等 价 于 规则 


email ::= head body 


其 意味 着 一 封 电子 邮件 先后 包含 一 个 头 和 一 个 体 。 其 次 ，DTD 中 允许 递归 定义 。 例 如 ， 


<!ELEMENT bintree ((bintree root bintree)|emptytree)> 


EM TIM: 一 棵 二 又 树 是 一 棵 空 树 ， 或 者 由 一 棵 左 子 树 、 一 个 根 和 一 棵 右 子 树 组 成 。 


A.2.2 XML 模式 


XML 模式 为 定义 XML 文档 的 结构 提供 了 一 种 特别 丰富 的 语言 。 它 的 一 个 特征 是 其 语法 


就 基于 XML 本 身 。 这 一 设计 决策 极 大 地 提升 了 可 读 性 ， 但 更 重要 的 是 ， 它 也 允许 技术 的 大 
幅 复 用 。 不 再 像 DTD 要 求 的 那样 需要 去 写 单 独 的 解析 器 、 编 辑 器 、 优 美的 输出 器 等 来 谋求 一 
种 单独 的 语法 ; 任何 XML 都 可 以 做 到 。 一 个 甚至 更 重要 的 改进 是 复 用 和 改善 模式 的 可 能 性 。 
XML 模式 支持 通过 扩展 或 限制 现 有 类 型 来 定义 新 的 类 型 。 与 基于 XML 的 语法 结合 起 来 ， 这 
一 特征 支持 从 其 他 模式 来 构建 模式 ， 因 而 减少 了 工作 负担 。 最 后 ，XML 模式 提供 了 一 个 数据 
类 型 的 精良 集合 ， 可 以 在 XML 文档 中 使 用 (DTD 仅 局 限于 字符 串 )。 


一 个 XML 模式 是 一 个 带 有 开始 标签 的 元 素 ， 形 如 


<xsd:schema 
xmins:xsd="http://www.w3.org/2000/10/XMLSchema" 


version="1.0"> 
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这 个 元 素 使 用 了 可 以 在 W3C 网 站 找到 的 XML 模式 的 模式 。 它 可 以 说 是 构建 新 模式 的 基 
础 。 前 级 xsd 指称 那个 模式 的 命名 空间 (下 一 节 详 细 解 释 命 名 空间 )。 如 果 前 缀 在 xmlns 属 
性 中 被 省 略 了 ， 那 么 我 们 默认 使 用 来 自 这 个 命名 空间 中 的 元 素 : 
<schema 
xmins="http://www.w3.org/2000/10/XMLSchema" 
version="1.0"> 
以 下 我 们 省 略 xsd ATR. 


ME, RIKE schema 元 素 。 它 们 最 重要 的 内 容 是 元 素 和 属性 类 型 的 定义 ， 使 用 数据 
类 型 来 定义 。 


1. 元 素 类 型 
元 素 类 型 的 语法 是 : 
<element name=". .."/> 


并 且 它 们 可 以 有 一 些 可 选 属 性 ， 例 如 类 型 ， 

type="..." 

或 者 势 约束 

e minOccurs="x", 其 中 x 可 以 是 任何 自然 数 (包括 零 )。 

。maxOccurs="x"， 其 中 x 可 以 是 任何 自然 数 (包括 零 ) 或 者 无 限制 。 

minOccurs 和 maxoccurs 是 DTD 提供 的 势 运算 符 ?、* 和 + 的 泛 化 。 当 势 约 束 没有 显 
式 提 供 时 ，minoccurs 和 maxoccurs 默认 值 为 1。 

下 面 是 一 些 例 子 。 


<element name="email" /> 
<element name="head" minOccurs="1" maxOccurs="1"/> 


<element name="to" minOccurs="1"/> 


2. 属性 类 型 
属性 类 型 的 语法 是 : 
<attribute name=". .."/> 


并 且 它 们 可 以 有 一 些 可 选 属性 ， 例 如 类 型 ， 
type="..." 


或 者 存在 (对 应 于 DTD 中 的 #OPTIONAL 和 IMPLIED), 
use="x"， 其 中 x 可 以 是 optional È required 3 prohibited, 
或 者 一 个 默认 值 (对 应 于 DTD 中 的 #FIXED 和 默认 值 )。 
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下 面 是 一 些 例子 : 


<attribute name="id" type="ID" use="required" /> 


<attribute name="speaks" type="Language" use="optional" 


242 default="en"/> 


3. 数据 类 型 

我 们 已 经 认识 到 了 数据 类 型 在 选择 上 的 高 度 局 限 性 是 DTD 的 一 个 关键 弱点 。XML 模式 
为 定义 数据 类 型 提供 了 强大 的 能 力 。 首 先 有 各 种 内 置 数据 类 型 built-in data type)。 这 里 只 罗 
列 了 一 些 。 

。 数值 数据 类 型 ， 包括 integer, short, Byte, long, float, decimal. 

。 字符 串 数 据 类 型 ， 包 括 string, ID, IDREF, CDATA, language. 

。 日 期 和 时 间 数 据 类 型 ， 包 括 time, data, gMonth, gYear. 

也 有 用 户 定义 数据 类 型 ( user-defined data type)， 包 括 不 能 使 用 元 素 或 属性 的 简单 数据 类 
型 (simple data type)， 和 可 以 使 用 元 素 和 属性 的 复杂 数据 类 型 (complex data type)。 我 们 首先 
讨论 复杂 类 型 ， 简 单数 据 类 型 的 讨论 推迟 到 我 们 讨论 限制 的 时 候 。 复 杂 类 型 从 现 有 的 数据 类 
型 定义 ， 通 过 定义 一 些 属性 (如 果 有 ) 并 使 用 

。 sequence， 现 有 数据 类 型 元 素 的 一 个 序列 ， 重 要 之 处 在 于 按 一 种 预定 义 顺 序 出 现 。 

。 all, 一 组 必须 出 现 但 其 顺序 并 不 重要 的 元 素 。 

e choice, 一 组 元 素 ， 其 中 之 一 将 被 选中 。 

这 是 一 个 例子 : 

<complexType name="lecturerType" > 

<sequence> 
<element name="firstname" type="string" 
minOccurs="0" maxOccurs="unbounded"/> 
<element name="lastname" type="string" /> 
243 </sequence> 
<attribute name="title" type="string" use="optional" /> 


</complexType> 


其 含义 是 一 个 XML 文档 中 的 一 个 被 声明 为 lecturerType 类 型 的 元 素 可 以 有 一 个 
title 属性 ; 它 也 可 以 包含 任意 数量 的 firstname 元 素 ， 并 且 必 须 仅 含 一 个 lastname 
TR. 

4. 数据 类 型 扩展 

现 有 数据 类 型 可 以 被 新 的 元 素 或 属性 扩展 。 作 为 一 个 例子 ,我 们 扩展 lecturer 数据 
类 型 。 


<complexType name="extendedLecturerType" > 


<complexContent> 
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<extension base="lecturer Type" > 
<sequence> 
<element name="email" type="string" 
minOccurs="0" maxOccurs="1"/> 
</sequence> 
<attribute name="rank" type="string" use="required" /> 
</extension> 
</complexContent> 


</complexType> 


在 这 个 例子 中 ，lecturerType 被 一 个 email 元 素 和 一 个 rank 属性 扩展 。 形 成 的 数据 类 
型 看 起 来 像 这 样 : 


<complexType name="extendedLecturerType"> 
<sequence> 
<element name="firstname" type="string" 
minOccurs="0" maxOccurs="unbounded"/> 


<element name="lastname" type="string"/> 
<element name="email" type="string" 


minOccurs="0" maxOccurs="1"/> 
</sequence> 
<attribute name="title" type="string" use="optional" /> 
<attribute name="rank" type="string" use="required" /> 


</complexType> 


在 原始 和 扩展 类 型 之 间 存 在 一 个 层次 关系 。 扩 展 类 型 的 实例 也 是 原始 类 型 的 实例 。 它 们 
可 以 包含 额外 的 信息 ， 但 不 能 包含 更 少 的 信息 或 者 错误 类 型 的 信息 。 

5. 数据 类 型 限制 

一 个 现 有 的 数据 类 型 也 可 以 通过 在 某 些 取 值 上 增加 约束 来 限制 。 例 如 ， 可 以 添加 新 的 
type 和 use 属性 ， 或 者 收 紧 minoccurs fil maxOccurs 的 数值 约束 。 

更 重要 的 是 ， 理 解 限制 不 是 扩展 的 对 立 过 程 。 限 制 并 不 通过 删除 元 素 或 属性 来 实现 。 因 
此 ， 以 下 层次 关系 仍然 成 立 : 限制 类 型 的 实例 也 是 原始 类 型 的 实例 。 它 们 至 少 要 满足 原始 类 
型 的 约束 和 一 些 新 的 约束 。 

作为 一 个 例子 ， 我们 限制 Lecturer 数据 类 型 如 下 : 


<complexType name="restrictedLecturerType" > 
<complexContent> 
<restriction base= "lecturerType" > 
<sequence> 
<element name="firstname" type="string" 


minOccurs="1" maxOccurs="2"/> 
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</sequence> 
<attribute name="title" type="string" use="required" /> 
</restriction> 
</complexContent> 


</complexType> 


收 紧 的 约束 用 粗 体 显示 。 读 者 应 当 将 它们 与 原始 值 进行 比较 。 
简单 数据 类 型 也 可 以 通过 限制 现 有 数据 类 型 来 定义 。 例 如 ， 我 们 可 以 如 下 定义 一 个 取 值 
为 1~31 的 dayofMonth 类 型 : 


<simpleType name="dayOfMonth" > 
<restriction base="integer"> 
<minInclusive value="1"/> 
<maxinclusive value="31"/> 
</restriction> 


</simpleType> 


也 可 以 通过 罗列 所 有 可 能 的 取 值 来 定义 一 个 数据 类 型 。 例 如 ， 我 们 可 以 如 下 定义 一 个 
dayOfWeek 数据 类 型 


<simpleType name="dayOfWeek" > 

<restriction base="string"> 
<enumeration value="Mon"/> 
<enumeration value="Tue"/> 
<enumeration value="Wed"/> 
<enumeration value="Thu"/> 
<enumeration value="Fri"/> 
<enumeration value="Sat"/> 
<enumecation value="Sun"/> 

</restriction> 


</simpleType> 


6. 一 个 总 结 性 的 例子 
这 里 我 们 为 email 定义 一 个 XML 模式 ; 使 得 它 可 以 和 早 前 提供 的 DTD 相 比 较 。 


<element name="email" type="email Type" /> 
<complexType name="emailType" > 
<sequence> 
<element name="head" type="headType"/> 
<element name="body" type= "bodyType"/> 
</sequence> 


</complexType> 
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<complexType name="head Type" > 
<sequence> 
<element name="from" type="nameAddress" /> 
<element name="to" type="nameAddress" 
minOccurs="1" maxOccurs="unbounded"/> 
<element name="cc" type="nameAddress" 
minOccurs="0" maxOccurs="unbounded" /> 
<element name="subject" type="string"/> 
</sequence> 


</complexType> 


<complexType name="nameAddress" > 
<attribute name="name" type="string" use="optional" /> 
<attribute name="address" type="string" use="required" /> 


</complexType> 


<complexType name="bodyType" > 


<sequence> 





<element name="text" type="string" /> 
<element name="attachment" minOccurs="0" 
maxOccurs="unbounded" > 
<complexType> 
<attribute name="encoding" use="optional" 
default="mime" > 
<simpleType> 
<restriction base="string" > 
<enumeration value="mime"/> 
<enumeration value="binhex" /> 
</restriction> 
</simpleType> 
</attribute> 
<attribute name="file" type="string" 
use="required" / > 
</complexType> 
</element> 
</sequence> 


</complexType> 


注意 ， 一 些 数 据 类 型 是 单独 定义 并 且 是 命 了 名 的 ， 而 剩 下 的 是 在 其 他 类 型 内 定义 并 且 是 
匿名 定义 的 (attachment JCR H encoding 属性 的 类 型 )。 一 般 而 言 ， 如 果 一 个 类 型 只 使 
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用 一 次 ， 为 了 局 部 使 用 而 匿名 定义 它 就 有 意义 了 。 然 而 ， 当 艇 套 很 深 时 ， 这 个 方法 很 快 就 会 
到 达 它 的 极限 。 
A3 ”命名 空间 

使 用 XML 作为 一 种 通用 (元 ) 标记 语言 的 一 项 主要 优势 是 可 以 存 取 各 种 来 源 的 信息 ; 用 
技术 术语 来 说 ， 一 个 XML 文档 可 以 使 用 超过 一 种 DTD 或 模式 。 但 因为 每 个 结构 化 文档 是 独 
立 开 发 的 , MAP R (name clash) 不 可 避免 地 会 出 现 。 如 果 DTD A 和 DTD B 用 不 同 的 方式 
定义 了 一 个 元 素 类 型 。， 那 么 一 个 试图 去 验证 一 个 出 现 了 e 元素 的 XML 文档 的 解析 器 必须 被 
告知 去 用 哪个 DTD 来 验证 。 

技术 解决 方案 很 简单 : 通过 为 每 个 DTD 或 模式 使 用 一 个 不 同 的 前 缀 来 消解 歧义 。 前 级 和 
局 部 名 称 之 间 用 问号 分 隔 : 

prefix:name 


作为 一 个 例子 ， 考 虑 一 所 (假想 的 ) 澳大利亚 大 学 一 一 例如 格 里 菲 斯 大 学 ， 和 一 所 美国 大 
学 一 一 例如 肯塔基 大 学 ， 合 作为 在 线 学 生 提 供 一 个 统一 的 视图 。 每 所 学 校 用 它 自 己 的 术语 ， 
因而 存在 一 些 差 异 。 例 如 ， 美 国 的 讲师 不 被 视 为 常规 教员 ， 而 在 澳大利亚 却 是 肯定 的 〈 事 实 
上 ， 他 们 对 应 于 美国 的 助理 教授 )。 下 面 这 个 例子 展现 了 如 何 消解 歧义 。 


<?xml version="1.0" encoding="UTF-16"?> 
<vu:instructors 
xmIns:vu="http://www.vu.com/empDTD" 
xmIns:gu="http://www.gu.au/empDTD" 
xmIns:uky="http://www.uky.edu/empDTD" > 
<uky:faculty ý 
uky:title="assistant professor" 
uky:name="John Smith" 
uky:department="Computer Science" /> 
<gu:academicStaff 
gu:title="lecturer" 
` gu:name="Mate Jones" 


gu:school="Information Technology" /> 
</vu:instructors> 


因此 ， 命 名 空间 在 一 个 元 素 内 声明 ， 并 且 可 以 用 于 该 元 素 及 其 孩子 (元素 和 属性 )。 一 个 
命名 空间 声明 具有 以 下 形式 : 


xmins:prefix="location" 


其 中 location 可 以 是 DTD 或 模式 的 地 址 。 如 果 未 指定 前 级 ， 例 如 ， 


xmlns="location" 
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IBA location 就 作为 其 默认 值 。 例 如 ， 上 一 个 例子 等 价 于 以 下 文档 : 


<?xml version="1.0" encoding="UTF-16"?> 
<vu:instructors 
xmins:vu="http://www.vu.com/empDTD" 
xmIins="http://www.gu.au/empDTD" 
xmIns:uky="http://www.uky.edu/empDTD"> 
<uky:faculty 
uky:title="assistant professor" 
uky:name="John Smith" 
uky:department="Computer Science" /> 
<academicStaff 
title="lecturer" 
name="Mate Jones" 
school="Information Technology" /> 


</vu:instructors> 


A4 寻 址 和 查询 XML 文档 

在 关系 数据 库 中 ， 一 个 数据 库 的 一 部 分 可 以 通过 诸如 SQL 查询 语言 来 选择 和 检索 。 对 
XML 文档 也 是 如 此 ， 存 在 一 些 查询 语言 的 提案 ， 例 如 XQL、XML-QL 和 XQuery. 

XML 查询 语言 的 核心 概念 是 路 径 描述 (path expression)， 指 明了 如 何 抵达 XML 文档 的 树 
表示 中 的 一 个 节点 或 一 个 节点 集 。 我 们 用 XPath 的 形式 介绍 路 径 描述 ， 因 为 它们 除了 查询 以 
外 还 有 别 的 用 处 一 一 转换 XML 文档 。 

XPath 是 一 种 寻 址 XML 文档 中 特定 部 分 的 语言 。 它 操作 XML 的 树 模 型 ， 并 具有 非 XML 
语法 。 关 键 概念 是 路 径 描 述 。 它 们 可 以 是 : 

。 绝 对 的 (从 树 根 开始 ) ; 在 语法 上 ， 它 们 以 符号 /开头 ， 其 指明 了 文档 的 根 ， 在 文档 根 

元 素 的 上 一 层 ; 或 者 : 





s 相对 于 一 个 上 下 文 节点 。 
考虑 以 下 XML 文档 : 


<?xml version="1.0" encoding="UTF-16"?> 
<!DOCTYPE library PUBLIC "library.dtd"> 
<library location="Bremen"> 
<author name="Henry Wise" > 
<book title="Artificial Intelligence" /> 
<book title="Modern Web Services" /> 
<book title="Theory of Computation" /> 
</author> 


<author name="William Smart"> 


252 


l 
253 
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<book title="Artificial Intelligence" /> 
</author> 


<author name="Cynthia Singleton" > 

<book title="The Semantic Web" /> 

<book title="Browser Technology Revised" /> 
</author> 


</library> 
它 的 树 表示 如 图 A-2 所 示 。 


以 下 我 们 用 一 些 路 径 描述 的 例子 来 示例 XPath 的 能 力 。 
1) 寻 址 所 有 author 元 素 。 


/library/author 


这 一 路 径 描 述 寻 址 到 紧 接 在 根 下 的 library 元 素 节点 的 孩子 中 的 所 有 author 元 素 。 
使 用 一 个 序列 /t/…/t,， 其 中 每 个 6 是 4 的 子 节点 ,我 们 通过 树 表示 定义 了 一 条 路 径 。 
2) 对 上 一 个 例子 的 男 一 种 解决 方案 是 : 


//author 


这 里 // 表明 我 们 应 该 考虑 文档 中 的 所 有 元 素 ， 并 检查 它们 是 否 具 有 类 型 author。 换 句 
话说 ， 这 一 路 径 描述 寻 址 文档 中 任何 位 置 的 所 有 author 元 素 。 由 于 我 们 XML 文档 的 特殊 
结构 ， 这 一 描述 和 前 一 个 会 产生 相同 的 结果 ， 但 一 般 来 说 它们 可 能 导致 不 同 的 结果 

3) Æ library 元素 节点 内 寻 址 location 属性 节点 。 


/library/@location 


符号 @ 用 来 指 代 属 性 节点 。 
4) 在 文档 各 处 的 book 元 素 内 寻 址 所 有 值 为 “Artificial Intelligence” 的 
title 属性 节点 (参见 图 A-3 )。 


//book/@title=[.="Artificial Intelligence"] 
5) 寻 址 所 有 题 为 “Artificial Intelligence” 的 图 书 (参见 图 A-4 )。 
//book[@title="Artificial Intelligence"] 


我 们 将 一 条 方 括号 内 的 测试 称 为 一 个 过 滤 描 述 (filter expression)。 它 限制 了 被 寻 址 的 节 
点 集 。 注 意 这 个 描述 和 查询 4 中 的 描述 的 区 别 。 这 里 ， 我 们 寻 址 那些 标题 满足 一 个 特定 条 件 、 
的 book 元 素 。 在 查询 4 中 ,我 们 收集 book THM title 属性 节点 。 比 较 图 A-3 和 A-4 将 
看 出 区 别 来 。 

6) 寻 址 XML 文档 中 的 第 一 个 author 元 素 节点 。 


//author[1] 
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7) 寻 址 文档 中 的 第 一 个 author 元 素 节点 中 的 最 后 一 个 book 元 素 。 
/ /author[1]/book[last()] 
8) 寻 址 所 有 没有 title 属性 的 book 元 素 节 点 。 


//book[not (@title)] 


这 些 例 子 体现 了 路 径 描述 的 描述 能 力 。 一 般 而 言 ， 一 个 路 径 描述 由 一 系列 由 斜 线 分 隔 的 


步骤 组 成 。 一 个 步骤 (step) 由 一 个 轴 选 择 符 、 一 条 节点 测试 和 一 个 可 选 的 谓词 组 成 。 
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e 一 个 轴 选 择 符 ( axis specifier) 决定 了 被 寻 址 的 节点 和 上 下 文 节点 之 间 的 树 关 系 。 例 如 
人 父母、 祖先、 孩子 (默认 )、 兄 弟 和 属性 节点 。/ 就 是 这 样 的 一 个 轴 选 择 符 ， 它 指 代 后 
裔 或 者 自身 。 i 

e 一 条 节点 测试 (node test) 指明 了 要 寻 址 哪些 节点 。 最 常见 的 节点 测试 是 元 素 名 称 (可 
以 使 用 命名 空间 信息 ), 但 也 有 其 他 的 。 例 如 ，* 寻 址 所 有 元 素 节 点 ，comment () 指 
所 有 注释 节点 ， 等 等 。 

e 谓词 (predicate) 或 称 过 滤 描 述 (filter expression)， 是 可 选 的 ， 用 来 精 化 被 寻 址 的 节点 
集 。 例 如 ， 描 述 [1] 选择 第 一 个 节点 ，[position ()=1last () ] 选择 最 后 一 个 节点 ， 
[position() mod 2 = 0] 选择 偶数 节点 ， 等 等 。 

我 们 已 经 呈现 的 是 缩写 的 语法 ， 但 XPath 实际 上 有 一 个 更 复杂 的 完整 语法 。 参 考 文献 在 

这 个 附录 的 最 后 可 以 找到 。 


A.5 处理 


到 目前 为 止 ， 我 们 还 没有 提供 任何 关于 如 何 显示 XML 文档 的 信息 。 这 样 的 信息 是 必要 
的 ， 因 为 不 同 于 HTML OC, XML 文档 并 不 包含 格式 信息 。 其 好 处 是 当 运 用 不 同 的 样式 表 
(style sheet) 时 ， 一 个 给 定 的 XML 文档 可 以 用 各 种 方式 呈现 。 例 如 ， 考 虑 以 下 XML 元 素 : 
<author> 
<name>Grigoris Antoniou</name> 
<affiliation>University of Bremen</affiliation> 
<email >ga@tzi.de</email> 


</author> 

如 果 用 了 一 个 样式 表 ， 那 么 输出 可 能 像 如 下 这 样 : 
Grigoris Antoniou 

University of Bremen 


ga@tzi.de 


或 者 ， 如 果 用 了 一 个 不 同 的 样式 表 ， 可 能 如 下 显现 ， 


Grigoris Antoniou 


University of Bremen 
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ga@tzi.de 


样式 表 可 以 用 多 种 语言 来 写 ， 例 如 CSS2 ( 层 释 样式 表 第 2 级 )。 另 一 种 可 能 是 XSL (可 
扩展 样式 表 语 言 )。 

XSL 包括 一 种 转换 语言 (XSLT) 和 一 种 格式 化 语言 。 显 然 ， 它 们 中 的 每 一 种 都 是 一 个 
XML 应 用 。XSLT 指明 了 一 个 输入 XML 文档 被 转换 为 另 一 个 XML 文档 (一 个 HTML 文档 
或 纯 文 本 ) 的 规则 。 输 出 文档 可 以 使 用 与 输入 文档 相同 的 DTD 或 模式 ， 或 者 可 以 使 用 一 个 完 
全 不 同 的 词汇 表 。 

XSLT ( XSL 转换 ) 可 以 独立 于 格式 化 语言 而 使 用 。 它 能 够 将 数据 和 元 数据 从 一 种 XML 
表示 迁移 为 男 一 种 ， 这 使 得 它 成 为 基于 XML 的 应 用 的 一 个 最 有 价值 的 工具 。 通 常 ， 当 使 用 
不 同 DTD 或 模式 的 应 用 需要 通信 和 时， 会 选择 XSLT。XSLT 是 一 个 用 于 机 器 对 内 容 的 处 理 而 
与 为 人 的 阅读 显示 信息 毫 不 相关 的 工具 。 尽 管 如 此 ， 接 下 来 我 们 仅 使 用 XSLT 来 显示 XML 
文档 。 . 

定义 一 个 XML 文档 呈现 的 一 种 方式 是 将 其 转换 为 一 个 HTML 文档 。 这 里 是 一 个 例子 。 
我 们 定义 一 个 用 于 上 面 作 者 例子 的 XSLT 文档 。 


<?xml version="1.0" encoding="UTF-16"?> 
<xsl:stylesheet version="1.0" 


xmins:xsl="http: //www.w3.org/1999/XSL/Transform" > 


<xsl:template match="/author"> 
<html> 
<head><title>An author< /title></head> 
<body bgcolor="white" > 
<b><xsl:value-of select="name"/></b><br></br> 
<xsl:value-of select="affiliation" /><br></br> 
<i><xsl:value-of select="email"/></i> 
</body> 
</html> 
</xsl:template> 


</xsl:stylesheet> 


这 个 样式 表 作 用 于 之 前 的 XML 文档 后 的 输出 产生 以 下 HTML 文档 (现在 定义 了 呈现 ): 


<html> 
<head> <title>An author< /title></head> 
<body bgcolor="white" > 
<b>Grigoris Antoniou< /b><br> 
University of Bremen<br> 


<i>ga@tzi.de</i> 


oo 
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</body> 


</html> 
让 我 们 来 观察 一 下 。XSLT 文档 是 XML 文档 ， 因 此 XSLT 建立 在 XML 之 上 ( 即 它 是 一 个 
XML 应 用 )。XSLT 文档 定义 了 一 个 模板 (template)， 这 种 情况 下 ， 就 是 一 个 HTML 文档 ， 包 
含 一 些 待 插入 内 容 的 占 位 符 (参见 图 A-5 )。 





<html> 
<head><title>An author</title></head> 
<body bgcolor="white"> 
<b>...</b><br> 
...<br> 
<i>...</i> 
</body> 
</html> 











图 A-5 一 个 模板 


在 之 前 的 XSLT 文档 中 , xs1 :value-of 检索 一 个 元 素 的 取 值 并 将 它 复制 到 输出 文档 中 。 
即 它 将 一 些 内 容 放 入 模板 中 。 

现在 假设 我 们 有 一 个 包含 几 个 作者 细节 的 XML 文档。 显然 单独 人 处理 每 个 author 元 素 
是 一 种 精力 的 浪费 。 在 这 样 的 情况 下 ， 为 author 元 素 定 义 一 个 特殊 的 模板 ， 被 主 模板 调用 。 
我 们 在 下 面 这 个 输入 文档 中 示例 这 个 方法 : 


<authors> 

<author> 
<name>Grigoris Antoniou< /name> 
<affiliation>University of Bremen< /affiliation> 
<email>ga@tzi.de< /email> 

</author> 

<author> 
<name>David Billington</name> 
<affiliation>Griffith University </affiliation> 
<email >david@gu.edu.net</email> 

</author> 


</authors> 


我 们 定义 以 下 XSLT 文档 : 
<?xml version="1.0" encoding="UTF-16"?> 
<xsl:stylesheet version="1.0" 


xmins:xsl="http://www.w3.org/1999/XSL/Transform" > 


<xsl:template match="/"> 
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<html> 
<head><title>Authors< /title></head> 
<body bgcolor="white" > 
<xsl:apply-templates select="authors" /> 
<!— Apply templates for AUTHORS children --> 
</body> 
</html> 


</xsl:template> 


<xsl:template match="authors" > 
<xsl:apply-templates select="author" /> 


</xsl:template> 


<xsl:template match="author" > 
<h2> <xsl:value-of select="name" /></h2> 
Affiliation: <xsl:value-of select="affiliation" /><br> 
Email: <xsl:value-of select="email" /> 
<p> 

</xsl:template> 


</xsl:stylesheet> 
产生 的 输出 是 : 


<html> 
<head> <title>Authors< /title></head> 
<body bgcolor="white" > 
<h2>Grigoris Antoniou</h2> 
Affiliation: University of Bremen<br> 
Email: ga@tzi.de 
<p> 
<h2>David Billington</h2> 
Affiliation: Griffith University<br> 
Email: david@gu.edu.net 
<p> 
</body> 


</html> 


xsl:apply-templates 元 素 让 上 下 文 节点 的 所 有 孩子 与 选择 的 路 径 描述 匹配 。 例 如 ， 
如 果 当 前 模板 作用 于 / ( 即 如 果 当 前 上 下 文 节点 是 根 )， 那 么 元 素 xsl:apply-templates fF 
用 于 根 元 素 一 一 在 这 个 情况 下 就 是 authors 元 素 ( 记 住 /在 根 元 素 之 上 )。 并 且 如 果 当 前 节 
点 是 authors 元 素 , 那么 xsl:apply-templates select="author" 元 素 让 author 
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元 素 的 模板 作用 于 authors 元 素 的 所 有 author BF. 

好 的 做 法 是 为 文档 中 的 每 种 元 素 类 型 定义 一 个 模板 。 即 使 没有 特定 的 处 理 要 作用 于 某 些 
元 素 一 一 比如 我 们 的 例子 中 ，xsl:apply-templLates 元 素 也 应 该 被 使 用 。 这 样 ， 从 树 的 根 
到 叶子 ， 所 有 模板 都 被 运用 了 。 

现在 我 们 将 注意 力 转移 到 属性 上 。 假 设 我 们 希望 用 XSLT 处 理 元 素 : 


<person firstname="John" lastname="Woo" /> 
让 我 们 尝试 可 以 想象 的 最 简单 的 任务 一 一 元 素 到 自身 的 转换 。 你 一 定 会 写成 : 


<xsl:template match="person" > 


<person 
firstname=" <xsl:value-of select="@firstname" >" 
lastname=" <xsl:value-of select="@lastname" >"/> 


</xsl:template> 


然而 ， 这 并 不 是 一 个 格式 良好 的 XML 文档 ， 因 为 标签 不 允许 出 现在 属性 值 中 。 但 其 
意图 是 清楚 的 ， 我 们 希望 将 属性 值 添加 到 模板 中 。 在 XSLT 中 ， 花 括号 内 的 数据 代替 了 
xsl:value-of 元 素 。 为 这 个 例子 定义 一 个 模板 的 正确 方式 如 下 : 


<xsl:template match="person" > 
<person 
firstname="{@firstname}" 
lastname="{@lastname}"/> 


</xsl:template> 


最 后 ， 我 们 给 出 一 个 从 一 个 XML 文档 到 男 一 个 的 转换 样 例 ， 其 并 未 指明 显示 部 分 。 我 们 再 
一 次 使 用 authors 文档 作为 输入 ， 并 如 下 定义 一 个 XSLT 文档 : 


<?xml version="1.0" encoding="UTF-16"?> 
<xsl:stylesheet version="1.0" 


xmins:xsl="http://www.w3.org/1999/XSL/Transform" > 


<xsl:template match="/"> 
<authors> 
<xsl:apply-templates select="authors" /> 
</authors> 


</xsl:template> 
<xsl:template match="authors" > 


<xsl:apply-templates select="author" /> 


</xsl:template> 


<xsl:template match="author"> 
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<author> 
<name> <xsl:value-of select="name" /></name> 
<contact> 
<institute> 
<xsl:value-of select="affiliation"/> 
</institute> 
<email> <xsl:value-of select="email" /></email> 
</contact> 
</author> 


</xsl:template> 


</xsl:stylesheet > 


输出 文档 的 树 表示 如 图 A-6 所 示 ， 展 现 了 XSLT 的 树 转换 特性 。 








' ` 
1 ' ' ` 
i 1 1 
University ga@tzi.de Griffith davidegu.edu.net 
of Bremen University 


图 A-6 XSLT 作为 树 转换 


1 1 ` 
' 1 i i ` 
1 1 1 1 ! ` 
Grigoris| |university| | ga@tzi de David Griffith davidegu.edu.net 
Antoniou of Bremen Billington| |University 
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